JP2013238933A - 画像処理装置、画像形成装置、プログラムおよびその記録媒体 - Google Patents

画像処理装置、画像形成装置、プログラムおよびその記録媒体 Download PDF

Info

Publication number
JP2013238933A
JP2013238933A JP2012110045A JP2012110045A JP2013238933A JP 2013238933 A JP2013238933 A JP 2013238933A JP 2012110045 A JP2012110045 A JP 2012110045A JP 2012110045 A JP2012110045 A JP 2012110045A JP 2013238933 A JP2013238933 A JP 2013238933A
Authority
JP
Japan
Prior art keywords
image
display
document
unit
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2012110045A
Other languages
English (en)
Inventor
Yosuke Konishi
陽介 小西
Akito Yoshida
章人 吉田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP2012110045A priority Critical patent/JP2013238933A/ja
Priority to PCT/JP2013/062270 priority patent/WO2013168590A1/ja
Publication of JP2013238933A publication Critical patent/JP2013238933A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition

Abstract

【課題】原稿の画像に重畳して表示されるテキスト画像における所望する文字列を容易に選択できるようにする。
【解決手段】描画コマンド生成部33は、原稿の画像にテキスト画像を重畳させて表示させる第1表示状態と、原稿の画像を表示させずにテキスト画像を表示させる第2表示状態との切り替えをコンピュータに実行させるためのコマンドを描画コマンドに含める。
【選択図】図2

Description

本発明は、原稿の画像データと上記原稿のテキストデータとを含む画像ファイルを生成する画像処理装置に関するものである。
従来、複合機等で紙文書からなる原稿を電子化する際、読み込まれた原稿の画像データに対して文字認識処理を行い、文字認識結果を透明テキストとして原稿の画像データに重畳させた画像ファイル(例えばサーチャブルPDFファイル)を生成する技術が知られている。
例えば、特許文献1には、文書画像と、その文書画像に対する文字認識処理によって得た複数の文字コードと、上記複数の文字コードに対応する文字を透明色で描画する際に複数の字種で共通利用させるための字形データとを含み、かつ1つの字種に対して複数種類の字形データが格納された電子文書を生成する画像処理装置が記載されている。
特開2009−146064号公報 特開平7−192086号公報 特開平6−189083号公報
しかしながら、従来の文字認識結果を透明テキストとして画像データに重畳させる技術では、例えば文字認識結果に基づく透明テキストを行単位で配置する場合などに、例えば透明テキストの描画用に指定された文字フォントと文字認識処理における推定フォントサイズとの差異などに起因して、画像データにおける文字位置と透明テキストにおける文字位置との間に位置ずれが生じる場合がある。このため、ユーザが表示装置に表示された原稿画像データを参照して行う操作に基づいて当該操作に対応する透明テキストの文字列を検出する際、ユーザが選択したい文字列が適切に検出されない場合がある。
本発明は、上記の問題点に鑑みてなされたものであり、その目的は、原稿の画像における文字位置とテキストデータにおける文字位置とが異なる場合であっても、ユーザがテキストデータにおける所望する文字列を容易に選択できるようにすることにある。
本発明の画像処理装置は、画像ファイルに含まれるデータに対してコンピュータに実行させる処理の処理内容を示す描画コマンドを生成する描画コマンド生成部と、原稿の画像データ、上記原稿に含まれる文字のテキストデータ、および、上記描画コマンド生成部が生成した描画コマンドを含む所定フォーマットの画像ファイルを生成するフォーマット化処理部とを備えた画像処理装置であって、上記描画コマンド生成部は、上記原稿の画像を表示装置に表示させる第1表示状態と、上記原稿の画像を表示させずに上記テキストデータの文字をユーザが視認できる色で配置した可視テキストを表示装置に表示させる第2表示状態との切り替えをコンピュータに実行させるためのコマンドを上記描画コマンドに含めることを特徴としている。なお、上記描画コマンド生成部は、上記第1表示状態において、上記テキストデータの文字をユーザが視認できない色で配置した透明テキストを上記原稿の画像に重畳させて表示装置に表示させるためのコマンドを上記描画コマンドに含める構成としてもよい。
上記の構成によれば、原稿の画像を表示させる第1表示状態と、原稿の画像を表示させずに可視テキストを表示させる第2表示状態とを適宜切り替えて表示させることができる。これにより、原稿の画像における文字位置と透明テキストにおける文字位置とが異なる場合であっても所望する文字列を容易に選択することができる。
また、原稿の画像データとテキストデータとが共通の画像ファイルに格納されており、この共通の画像ファイルを開いて原稿が表示される状態と原稿が表示されずに可視テキストが表示される状態とを切り替えることができる。したがって、原稿の画像データを含むデータファイルと可視テキストを含むデータファイルとを別々に生成する場合のように、原稿を閲覧したいのに誤って可視テキストのデータファイルを開いてしまったり、可視テキストを閲覧したいのに誤って原稿のデータファイルを開いてしまったりすることを防止できる。
また、上記原稿に含まれる文字のテキストデータを取得する文字情報取得部を備え、上記文字情報取得部は、上記原稿の画像データに対して文字認識処理を行うことで上記テキストデータを取得するか、あるいは、上記原稿の画像データに予め付加されているテキストデータを抽出することで上記テキストデータを取得する構成としてもよい。
上記の構成によれば、原稿の画像データに対して文字認識処理を行うか、あるいは、原稿の画像データに予め付加されているテキストデータを抽出することでテキストデータを取得し、取得したテキストデータに基づいて上記描画コマンドおよび上記画像ファイルを生成することができる。
また、上記描画コマンド生成部は、ユーザが上記第1表示状態と上記第2表示状態との切り替えの指示入力を行うための操作対象となる表示切替ボタンを表示装置に表示させる処理をコンピュータに実行させるためのコマンド、およびユーザから上記画像ファイルの印刷指示がなされた場合に上記表示切替ボタンを除いた画像を印刷する処理をコンピュータに実行させるためのコマンドを上記描画コマンドに含める構成としてもよい。
上記の構成によれば、画像ファイルを表示装置で閲覧する際に第1表示状態と第2表示状態とを切り替えるための操作対象となる表示切替ボタンを表示させることにより、ユーザの利便性を向上させることができる。また、印刷時には表示切替ボタンを印刷対象から除外することで、不要な情報が印刷されることを防止できる。
また、上記描画コマンド生成部は、上記原稿が複数ページからなる場合に、上記表示切替ボタンを上記原稿の各ページの画像に対応する位置にそれぞれ表示させ、かつユーザが上記表示切替ボタンを用いて上記第1表示状態と上記第2表示状態との切り替えの指示入力を行った場合に当該指示入力に対応する上記第1表示状態と上記第2表示状態との切り替え処理を原稿の全ページに対して共通に適用する構成としてもよい。
上記の構成によれば、複数ページのうちのいずれかのページに対応する表示切替ボタンを操作することにより、当該操作に対応する表示状態の切り替えを全ページに対して共通に適用することができるので、ユーザの利便性を向上させることができる。
また、上記描画コマンド生成部は、初期状態では上記表示切替ボタンに重畳する位置に表示される他の画像をユーザが視認できるように上記表示切替ボタンを半透明で表示し、ユーザによる所定の操作が行われた場合に上記表示切替ボタンの表示濃度を上記初期状態よりも高める処理をコンピュータに実行させるためのコマンドを上記描画コマンドに含める構成としてもよい。
上記の構成によれば、ユーザが表示切替ボタンを利用するとき以外は表示切替ボタンを半透明で表示させることにより、表示切替ボタンが画像の閲覧の邪魔になることを抑制できる。また、ユーザが表示切替ボタンを利用する場合には、ユーザが所定の操作を行うことにより、表示切替ボタンを視認しやすい状態で表示させることができる。なお、上記の所定の操作としては、例えば、表示切替ボタン上にマウス等のポインティングデバイスを用いてカーソルを重ね合わせる操作などが挙げられる。
また、上記描画コマンド生成部は、上記所定の操作が行われた場合に、上記表示切替ボタンの近傍に当該表示切替ボタンを操作することによって入力される指示内容を示す画像を表示させる処理をコンピュータに実行させるためのコマンドを上記描画コマンドに含める構成としてもよい。
上記の構成によれば、ユーザが所定の操作を行うことにより表示切替ボタンの近傍に当該表示切替ボタンを操作することによって入力される指示内容を示す画像を表示させることができるので、ユーザの利便性を向上させることができる。
本発明の画像形成装置は、上記したいずれかの画像処理装置を備えていることを特徴としている。
上記の構成によれば、原稿の画像における文字位置と透明テキストにおける文字位置とが異なる場合であっても必要に応じて第1表示状態と第2表示状態とを切り替えることで所望する文字列を容易に選択することができる。また、原稿を閲覧したいのに誤って可視テキストのデータファイルを開いてしまったり、可視テキストを閲覧したいのに誤って原稿のデータファイルを開いてしまったりすることを防止できる。
また、本発明の画像処理装置は、コンピュータによって実現されてもよく、この場合には、コンピュータを上記各部として動作させることにより、上記画像処理装置をコンピュータにて実現させるプログラム、およびそれを記録したコンピュータ読み取り可能な記録媒体も、本発明の範疇に含まれる。
以上のように、本発明によれば、原稿の画像における文字位置と透明テキストにおける文字位置とが異なる場合であっても必要に応じて第1表示状態と第2表示状態とを切り替えることで所望する文字列を容易に選択することができる。また、原稿を閲覧したいのに誤って可視テキストのデータファイルを開いてしまったり、可視テキストを閲覧したいのに誤って原稿のデータファイルを開いてしまったりすることを防止できる。
本発明の一実施形態にかかる画像形成装置の構成、および上記画像形成装置における画像形成モードでのデータの流れを示すブロック図である。 図1に示した画像形成装置における画像送信モードでのデータの流れを示すブロック図である。 図1に示した画像形成装置における概略的な処理の流れを示すフローチャートである。 図1に示した画像形成装置に備えられる原稿検知部の概略構成を示すブロック図である。 (a)〜(c)は、図1に示した画像形成装置において生成される画像ファイルに記述される情報(描画コマンド)の一例を示す説明図である。 (a)および(b)は、図1に示した画像形成装置において生成される画像ファイルに記述される情報(描画コマンド)の一例を示す説明図である。 (a)〜(c)は、図1に示した画像形成装置において生成される画像ファイルに記述される情報(描画コマンド)の一例を示す説明図である。 図1に示した画像形成装置において生成された画像ファイルを表示装置に表示させる際の表示状態の切り替え処理を説明するための説明図である。 (a)および(b)は図1に示した画像形成装置において生成された画像ファイルに基づいて表示装置に表示される表示画面の例を示している。 (a)〜(d)は図1に示した画像形成装置において生成される画像ファイルに記述される情報(描画コマンド)の一例を示す説明図である。 図1に示した画像形成装置において生成された画像ファイルを表示装置に表示させる際の表示状態の切り替え処理の一例を説明するための説明図である。 (a)〜(c)は図1に示した画像形成装置において生成される画像ファイルに記述される情報(描画コマンド)の一例を示す説明図である。 (a)および(b)は図1に示した画像形成装置において生成された画像ファイルを表示装置に表示させる際に表示される表示切替ボタン、およびその表示状態の切り替えを説明するための説明図である。 図1に示した画像形成装置において生成される画像ファイルに記述される情報(描画コマンド)の一例を示す説明図である。 図1に示した画像形成装置において生成された画像ファイルを表示装置に表示させる際の表示状態の切り替え処理の一例を説明するための説明図である。 図1に示した画像形成装置において生成された画像ファイルを表示装置に表示させる際の表示状態の切り替え処理の一例を説明するための説明図である。 図1に示した画像形成装置において行われるファイルフォーマットの判定処理の流れを示すフローチャートである。 本発明をカラー画像読取装置に適用する場合の構成例を示すブロック図である。
本発明の一実施形態について説明する。なお、本実施形態では、本発明をデジタルカラー複合機に適用する場合の例について主に説明するが、本発明の適用対象はこれに限るものではなく、原稿の画像データと上記原稿のテキストデータとを含む画像ファイルを生成する機能を有する装置であれば適用できる。
(1)デジタルカラー複合機の全体構成
図1および図2は、本実施形態にかかるデジタルカラー複合機(画像処理装置、画像形成装置、画像読取装置)1の概略構成を示すブロック図である。なお、デジタルカラー複合機1は、が原稿を読み取って取得した画像データに応じた画像を記録材上に形成(印刷)する画像形成モードと、原稿を読み取って取得した画像データに上記原稿に含まれる文字のテキストデータを付加した画像ファイルを生成し、外部装置に送信する画像送信モードとを備えている。また、図1は画像形成モードにおけるデータの流れを示しており、図2は画像送信モードにおけるデータの流れを示している。
図1および図2に示すように、デジタルカラー複合機1は、画像入力装置2、画像処理装置3、画像出力装置4、通信装置5、および操作パネル6を備えている。
画像入力装置2は、CCD(Charge Coupled Device)ラインセンサを備えたスキャナであり、原稿から反射されてきた光をR、G、B(R:赤・G:緑・B:青)に色分解された電気信号(画像データ)に変換して画像処理装置3に出力する。なお、画像入力装置2の構成は特に限定されるものではなく、例えば原稿載置台に載置された原稿を読み取るものであってもよく、原稿搬送手段によって搬送されている原稿を読み取るものであってもよい。
画像処理装置3は、図1および図2に示すように、A/D変換部11、シェーディング補正部12、入力処理部13、原稿検知部14、原稿補正部15、色補正部16、黒生成下色除去部17、空間フィルタ処理部18、出力階調補正部19、中間調生成部20、領域分離部21、ファイル生成部30、記憶部23、および制御部24を備えている。
画像処理装置3は、画像形成モードでは、画像入力装置2から入力された画像データに種々の画像処理を施して得られるCMYKの画像データを画像出力装置4に出力する。
また、画像処理装置3は、画像送信モードとして、通常送信モードと簡易送信モードとを備えている。通常送信モードでは、画像処理装置3は、画像入力装置2から入力された画像データに傾き補正処理および天地補正処理を施し、これら各処理が施された画像データに基づいて一般に普及している表示装置の表示特性に適合したR’G’B’の画像データ(例えば、sRGBデータ)を生成する。また、画像処理装置3は、画像入力装置2から入力された画像データに対して文字認識処理を施して当該画像データに対応する原稿に含まれる文字のテキストデータ(文字データ)を生成する。そして、上記のR’G’B’の画像データと、上記テキストデータと、上記画像データおよび上記テキストデータを表示装置に表示させる際の表示条件等を示す描画コマンドとを含む所定フォーマットの画像ファイルを生成し、通信装置5に出力する(あるいは所定の保存先に保存する)。
また、画像処理装置3は、簡易送信モードでは、画像入力装置2から入力された画像データ(傾き補正処理および天地方向補正処理を施していない画像データ)に基づいて一般に普及している表示装置の表示特性に適合したR’G’B’の画像データ(例えば、sRGBデータ)を生成する。また、画像処理装置3は、画像入力装置2から入力された画像データに対して文字認識処理を施し、当該画像データに対応する原稿に含まれる文字のテキストデータを生成する。そして、上記のR’G’B’の画像データと、上記テキストデータと、上記のR’G’B’の画像データを表示させる際に適用すべき傾き補正処理、天地方向補正処理等の画像処理内容に関するパラメータや上記のR’G’B’の画像データおよび上記テキストデータの表示条件などを示す描画コマンドを含む所定フォーマットの画像ファイルを生成し、通信装置5に出力する(あるいは所定の保存先に保存する)。
なお、画像処理装置3に備えられる各部の詳細、および画像処理装置3の動作の詳細については後述する。
画像出力装置4は、画像処理装置3から入力された画像データを記録材(例えば紙等)上に出力するものである。画像出力装置4の構成は特に限定されるものではなく、例えば、電子写真方式やインクジェット方式を用いた画像出力装置を用いることができる。
通信装置(送受信部)5は、例えばモデムやネットワークカードより構成され、ネットワークカード、LANケーブル等を介して、ネットワークに接続された他の装置(例えば、パーソナルコンピュータ、サーバ装置、表示装置、他のデジタル複合機、ファクシミリ装置等)とデータ通信を行う。
操作パネル6は、例えば、液晶ディスプレイなどの表示部と設定ボタンなどより構成され(いずれも図示せず)、デジタルカラー複合機1の主制御部(図示せず)の指示に応じた情報を上記表示部に表示するとともに、上記設定ボタンを介してユーザから入力される情報を上記主制御部に伝達する。
記憶部23は、画像処理装置3で扱われる各種データ(画像データ等)を記憶する記憶手段である。記憶部23の構成は特に限定されるものではないが、例えばハードディスクなどを用いることができる。
なお、デジタルカラー複合機1が、画像データを符合化してから記憶部23に記憶させる符合化モードを備えていてもよい。例えば、操作パネル6を介してユーザが符合化モードを選択するか否かを指定するようにしてもよい。符号化モードが選択されている場合、記憶部23に記憶させる画像データは符号化部(図示せず)によって符号化された上で記憶部23に記憶される。一方、符号化モードが選択されていない場合には画像データは符号化部をスルーして符号化されずに記憶部23に記憶される。また、記憶部23から読み出した画像データが符号化されている場合、当該画像データは復号化部(図示せず)によって復号化されてから所定の処理ブロックに伝達される。なお、記憶部23に保存されている画像データが2値画像データである場合、復号化の際に多値(例えば8ビット)画像データへの変換処理も行うようにしてもよい。
制御部24は、CPUや専用プロセッサなどの演算処理部、および、RAM、ROM、HDDなどの記憶部(いずれも図示せず)などにより構成されるコンピュータ装置であり、記憶部23に記憶されている各種情報および各種制御を実施するためのプログラムを読み出して実行することで画像処理装置3に備えられる各部の動作を制御する。また、制御部24は、画像処理装置3の内部におけるデータの流れや、記憶部23に対するデータの読み書きなどを制御する。なお、制御部24は、デジタルカラー複合機1の主制御部(図示せず)に備えられるものであってもよく、主制御部とは別に備えられ、主制御部と協働して処理を行うものであってもよい。
デジタルカラー複合機1の主制御部は、CPUや専用プロセッサなどの演算処理部、および、RAM、ROM、HDDなどの記憶部(いずれも図示せず)などにより構成されるコンピュータ装置であり、図示しないROM等に格納されたプログラムや各種データ、操作パネル6から入力される情報等に基づいて、デジタルカラー複合機1の各部の動作を制御する。
(2)画像処理装置3における処理の概要
図3は、画像処理装置3における概略的な処理の流れを示すフローチャートである。この図に示すように、まず、制御部24は、操作パネル6を介して入力されるユーザからの処理モードの選択指示を受け付ける(S1)。また、制御部24は、画像入力装置2が原稿を読み取って生成した画像データを取得する(S2)。なお、詳細は後述するが、画像入力装置2から取得した画像データはA/D変換部11、シェーディング補正部12、および入力処理部13において所定の処理が施された後、一旦記憶部23に記憶される。
次に、制御部24は、S1で選択指示された処理モードが画像形成モードであるか否かを判断する(S3)。
S3において画像形成モードであると判断した場合、制御部24は、原稿検知部14に画像データにおける原稿の傾き角度検知処理を行わせ(S4)、傾き角度検知結果に基づいて原稿補正部15に傾き補正処理を行わせる(S5)。また、制御部24は、原稿検知部14に画像データにおける原稿の天地方向判定処理を行わせ(S6)、天地方向判定結果に基づいて原稿補正部15に天地方向補正処理を行わせる(S7)。そして、傾き補正処理および天地方向補正処理が施された原稿の画像データに対して後述する色補正処理、黒生成下色除去処理、空間フィルタ処理、出力階調補正処理、および中間調生成処理を行わせてから画像出力装置4に出力させ(S8)、処理を終了する。
S3において画像形成モードではないと判断した場合、制御部24は、原稿検知部14に画像データにおける原稿の傾き角度検知処理を行わせ(S9)、傾き角度検知結果に基づいて原稿補正部15に傾き補正処理を行わせる(S10)。また、制御部24は、原稿検知部14に画像データにおける原稿の天地方向判定処理を行わせ(S11)、天地方向判定結果に基づいて原稿補正部15に天地方向補正処理を行わせる(S12)。S1で選択指示された処理モードが簡易送信モードではない場合(通常通信モードであると判断した場合)、傾き補正処理および天地方向補正処理が施された原稿の画像データは、色補正処理、空間フィルタ処理、および中間調生成処理が施された後、ファイル生成部30に入力される。あるいは、傾き補正処理および天地方向補正処理が施された原稿の画像データをファイル生成部30に直接入力するようにしてもよい。S10における傾き補正処理は、後述する2値化された画像データを用いた傾き補正処理であり、天地方向判定処理、文字認識処理を精度よく行うための処理である。また、S12の天地方向補正処理も上記2値化された画像データを用いた補正処理であり、文字認識処理を精度よく行うための処理である。
一方、S1において選択指示された処理モードが簡易送信モードであると判断した場合、傾き角度検知処理および天地方向判定処理の結果はファイル生成部30に入力される。また、記憶部23から読み出された原稿の画像データは、傾き補正処理および天地方向補正処理を施されることなく、色補正処理、空間フィルタ処理、および中間調生成処理が施されてからファイル生成部30に入力される。あるいは、記憶部23から読み出された原稿の画像データをファイル生成部30に直接入力するようにしてもよい。
また、制御部24は、ファイル生成部30の文字認識部32に原稿の画像データに対する文字認識処理を行わせ(S13)、描画コマンド生成部33に文字認識結果に基づくテキストレイヤ情報(透明テキストデータおよび可視テキストデータ)を生成させるとともに(S14)、原稿の画像データおよびテキストレイヤ情報を表示させる際の表示条件等を示す描画コマンドを生成させる(S15)。なお、制御部24は、簡易送信モードの場合には、原稿の画像データに対して適用すべき傾き補正処理および天地方向補正処理を示すコマンドを描画コマンドに含める。描画コマンドとは、画像ファイルの画像を表示装置に表示させる際の表示条件、画像ファイルに含まれる画像データに対して適用すべき画像処理条件、画像ファイルの画像を印刷装置で印刷する際の印刷条件などを、これら各処理を行うコンピュータに対して指示するためのコマンドである。
また、制御部24は、ファイル生成部30のフォーマット化処理部34に、中間調生成部20からファイル生成部30に入力される原稿の画像データ、上記テキストレイヤ情報、および上記描画コマンドを所定のフォーマット(本実施形態ではPDFフォーマット)に従ってフォーマット化した画像ファイルを生成させる(S16)。その後、制御部24は、フォーマット化処理部34によって生成された画像ファイルを通信装置5に出力させ(S17)、処理を終了する。
なお、本実施形態では、画像送信モードの場合には必ず原稿の画像データと原稿のテキストデータとを含む画像ファイルを生成するものとしているが、これに限るものではない。例えば、テキストデータを含む画像ファイルを生成するかテキストデータを含まない画像ファイルを生成するかをユーザが任意に選択できるようにしてもよい。
(3)画像形成モードの動作
次に、画像形成モードにおける画像処理装置3の動作についてより詳細に説明する。画像形成モードの場合、図1に示すように、まず、A/D変換部11が、画像入力装置2が原稿を読み取って取得したRGBのアナログ信号をデジタル信号に変換してシェーディング補正部12に出力する。
シェーディング補正部12は、A/D変換部11から送られてきたデジタルのRGB信号に対して、画像入力装置2の照明系、結像系、撮像系で生じる各種の歪みを取り除く処理を施し、入力処理部13に出力する。
入力処理部13は、シェーディング補正部12にて各種の歪みが取り除かれたRGB信号に対してガンマ補正などの各種処理行う。また、入力処理部13は、上記の各種処理を施した画像データを記憶部23に記憶させる。
原稿検知部14は、入力処理部13によって記憶部23に記憶された画像データを読み出して当該画像データに示される原稿画像の傾き角度を検知し、検知した傾き角度(検知結果)を原稿補正部15に出力する。原稿補正部15は、原稿検知部14から伝達された傾き角度に基づいて、記憶部23に記憶されている画像データを読み出して原稿の傾き補正を行い、傾き補正後の画像データを記憶部23に記憶させる。
また、原稿補正部15によって傾き補正が行われた後、原稿検知部14は、記憶部23に記憶されている傾き補正後の画像データを読み出し、この画像データに基づいて原稿の天地方向の判定を行い、判定結果を原稿補正部15に出力する。原稿補正部15は、原稿の天地方向の判定の判定結果に応じて、記憶部23に保存されている傾き補正後の画像データを読み出して天地方向補正処理を行う。傾き補正処理および天地方向補正処理が施された画像データは色補正部16および領域分離部21に出力される。
図4は、原稿検知部14の概略構成を示すブロック図である。この図に示すように、原稿検知部14は、信号変換部51、解像度変換部52、2値化処理部53、原稿傾き検知部54、天地方向検知部55を備えている。
信号変換部51は、記憶部23から入力される画像データを無彩化して、明度信号もしくは輝度信号に変換するものである。例えば、信号変換部51は、Yi=0.30Ri+0.59Gi+0.11Biを演算することによりRGB信号(画像データ)を輝度信号Yに変換する。ここで、Yは各画素の輝度信号であり、R,G,Bは各画素のRGB信号における各色成分であり、添え字のiは画素毎に付与された値(iは1以上の整数)である。
あるいは、信号変換部51が、RGB信号をCIE1976L***信号(CIE:Commission International de l'Eclairage、L*:明度、a*,b*:色度)に変換するようにしてもよく、RGB信号におけるG信号を輝度信号として用いるようにしてもよい。
解像度変換部52は、信号変換部51にて無彩化された画像データ(輝度値(輝度信号)または明度値(明度信号))を低解像度に変換する。例えば、1200dpi、750dpi、あるいは600dpiで読み込まれた画像データを300dpiに変換する。解像度変換の方法は特に限定されるものではなく、例えば、公知のニアレストネイバー法、バイリニア法、バイキュービック法などを用いることができる。
2値化処理部53は、低解像度に変換された画像データと、予め設定された閾値とを比較することにより画像データを2値化し、2値化した画像データを、傾き検知処理の場合には原稿傾き検知部54に、天地方向検出処理の場合には天地方向検知部55に出力する。なお、例えば、画像データが8ビットである場合、上記閾値を128とする。あるいは、複数の画素(例えば5画素×5画素)からなるブロックにおける濃度(画素値)の平均値を閾値としてもよい。
原稿傾き検知部54は、2値化処理部53によって2値化された画像データに基づいて、画像読取時のスキャン範囲(正規の原稿位置)に対する原稿の傾き角度を検知し、検知結果を原稿補正部15に出力する。
傾き角度の検知方法は特に限定されるものではなく、従来から公知の種々の方法を用いることができる。例えば、特許文献2に記載されている方法を用いてもよい。この方法では、2値化された画像データからを黒画素と白画素との境界点(例えば各文字の上端における白/黒の境界点の座標)を複数個抽出し、各境界点の点列の座標データを求める。そして、この点列の座標データに基づいて回帰直線を求め、その回帰係数bを下記式(1)に基づいて算出する。
Figure 2013238933
なお、Sx,Syはそれぞれ変量x,yの残差平方和であり、Sxyはxの残差とyの残差の積の和である。すなわち、Sx,Sy,Sxyは上記式(2)〜(4)で表される。
そして、上記のように算出した回帰係数bより、下記式(5)に基づいて傾き角度θを算出する。
tanθ=b ・・・式(5)
天地方向検知部55は、2値化処理部53によって2値化された画像データに基づいて、記憶部23に記憶されている画像データに示される原稿画像の天地方向を判定し、判定結果を原稿補正部15に出力する。
天地方向の判定方法は特に限定されるものではなく、従来から公知の種々の方法を用いることができる。例えば、特許文献3に記載されている方法を用いてもよい。
特許文献3の方法では、画像データに基づいて文字認識処理を行い、原稿内の各文字を文字毎に切り出して各文字をパターン化する。なお、この処理は、2値化され、300dpiに低解像度化された画像データを用いて行う。また、必ずしも全ての文字について文字認識処理を行う必要は無く、例えば予め定められた数の文字を抽出して行うようにしてもよい。
その後、文字パターンの特徴と予めデータベース化された文字パターン情報とのマッチング(比較)を行う。マッチングの方法としては、データベース化された文字パターンに画像データから切り出された文字パターンを重ね合わせて画素ごとの白黒を比較し、画像データにおける文字を、データベース化された各文字パターンのうち全ての画素が合致する文字パターンの文字として判別する。なお、全てが合致する文字パターンがない場合、画像データにおける文字を、マッチングする画素が最も多い文字パターンの文字として判別する。ただし、マッチングする画素数の割合が所定のマッチング割合に達しなければ判別不能と判断する。
そして、画像データを90°、180°、270°回転させた場合のそれぞれについて、上記の文字認識処理を行う。その後、0°、90°、180°、270°のぞれぞれの場合について、判別可能な文字数を算出し、判別可能な文字数が最も多い回転角度を文字方向、すなわち原稿の天地方向として判定する。そして、画像データにおける原稿画像の天地方向を正規の天地方向に一致させるための回転角度を判定する。具体的には、正規の天地方向に対して時計回りの方向の角度を正とし、画像データにおける原稿画像の天地方向(基準方向)と正規の天地方向とが一致している場合を0°、画像データにおける原稿画像の天地方向が正規の天地方向に対して−90°異なっている場合に上記回転角度を90°、画像データにおける原稿画像の天地方向が正規の天地方向に対して−180°異なっている場合に上記回転角度を180°、画像データにおける原稿画像の天地方向が正規の天地方向に対して−270°異なっている場合に上記回転角度を270°とする。原稿検知部14は、上記回転角度を、天地方向の判定結果として原稿補正部15(図1参照)に出力する。そして、原稿補正部15は、記憶部23に記憶されている画像データに対して上記の回転角度だけ回転処理を施す。
色補正部16は、原稿検知部14および原稿補正部15による処理が完了した後の画像データを原稿補正部15から入力され、当該画像データを、RGB信号の補色であるCMY(C:シアン・M:マゼンタ・Y:イエロー)の画像データに変換するとともに、色再現性を高める処理を行う。
領域分離部21は、原稿検知部14および原稿補正部15による処理が完了した後の画像データを原稿補正部15から入力され、当該画像データの画像中の各画素を黒文字領域、色文字領域、網点領域、印画紙写真(連続階調領域)領域の何れかに分類する。領域分離部21は、分類結果に基づき、画素がどの領域に属しているかを示す領域分離データ(領域分離信号)を、黒生成下色除去部17、空間フィルタ処理部18、および中間調生成部20へと出力する。領域分離処理の方法は特に限定されるものではなく、従来から公知の方法を用いることができる。黒生成下色除去部17、空間フィルタ処理部18、および中間調生成部20では、入力された領域分離信号に基づいて、各領域に適した処理が行われる。
黒生成下色除去部17は、色補正後のCMYの3色信号から黒(K)信号を生成する黒生成、元のCMY信号から黒生成で得たK信号を差し引いて新たなCMY信号を生成する処理を行うものである。これにより、CMYの3色信号はCMYKの4色信号に変換される。
空間フィルタ処理部18は、黒生成下色除去部17より入力されるCMYK信号の画像データに対して、領域分離データを基にデジタルフィルタによる空間フィルタ処理(強調処理および/または平滑化処理)を行い、空間周波数特性を補正する。これにより、出力画像のぼやけや粒状性劣化を軽減することができる。
出力階調補正部19は、用紙等の記録材に出力するための出力γ補正処理を行い、出力γ補正処理後の画像データを中間調生成部20に出力する。
中間調生成部20は、最終的に画像を画素に分離してそれぞれの階調を再現できるように処理する階調再現処理(中間調生成)を画像データに施す。
上述した各処理が施されて中間調生成部20から出力された画像データは、一旦、図示しないメモリ(あるいは記憶部23)に記憶されたのち、所定のタイミングで読み出されて画像出力装置4に入力され、画像出力装置4は当該画像データに基づいて印刷を行う。
なお、上述した画像形成モードの処理では、原稿補正部15による処理が完了した後の画像データが原稿補正部15から色補正部16に引き渡されるものとしているがが、これに限るものではない。例えば、原稿補正部15による処理が完了した後の画像データをファイリングデータとして一旦記憶部23に記憶させるようにしてもよい。この場合、原稿補正部15による処理が完了した後の画像データは、例えば、JPEG圧縮アルゴリズムに基づいてJPEGコードに圧縮されて記憶部23に格納される。そして、コピー出力動作やプリント出力動作が指示されたときに、記憶部23からJPEGコードが引き出され、RGBの画像データに変換される。RGBに変換された画像データは原稿補正部15をスルーして、色補正部16と領域分離部21とに送られる。なお、ファイリングデータの管理やデータの引渡しの動作制御については制御部24が行う。
(4)画像送信モード
次に、画像送信モードにおける画像処理装置3の動作について、図2を参照しながらより詳細に説明する。なお、通常送信モードにおけるA/D変換部11、シェーディング補正部12、入力処理部13、および領域分離部21の処理は、画像形成モード時と略同様である。
原稿検知部14は、画像形成モードと同様の動作を行うとともに、2値化および低解像度化した画像データをファイル生成部30(ファイル生成部30の情報抽出部31)に出力する。
原稿補正部15は、通常送信モードの場合には画像形成モードと同様の動作を行い、傾き補正処理および天地方向補正処理を施した原稿の画像データを色補正部16に出力する。また、原稿補正部15は、簡易送信モードの場合には原稿の画像データに傾き補正処理および天地方向補正処理を施すことなく色補正部16に出力する。
色補正部16は、原稿補正部15から入力されたRGBの画像データを、一般に普及している表示装置の表示特性に適合したR’G’B’の画像データ(例えば、sRGBデータ)に変換し、黒生成下色除去部17に出力する。黒生成下色除去部17は、画像送信モードでは色補正部16から入力された画像データをそのまま空間フィルタ処理部18に出力(スルー)する。
空間フィルタ処理部18は、黒生成下色除去部17から入力されるR’G’B’の画像データに対して、領域識別信号を基にデジタルフィルタによる空間フィルタ処理(強調処理および/または平滑化処理)を行い、出力階調補正部19に出力する。出力階調補正部19は、画像送信モードでは空間フィルタ処理部18から入力された画像データをそのまま中間調生成部20に出力(スルー)する。
中間調生成部20は、出力階調補正部19から入力されたR’G’B’の画像データに対して領域識別信号を基に所定の処理を施し、ファイル生成部30(ファイル生成部30に備えられるフォーマット化処理部34)に出力する。
ファイル生成部30は、図2に示したように、情報抽出部(文字情報取得部)31、文字認識部(文字情報取得部)32、描画コマンド生成部33、およびフォーマット化処理部34を備えている。
情報抽出部31は、通常送信モードでは、原稿検知部14から入力された画像データ(2値化および低解像度化された画像データ)をそのまま文字認識部32に出力(スルー)する。また、情報抽出部31は、簡易送信モードでは、原稿検知部14から入力されたデータから傾き角度検知結果および天地方向判定結果を示すデータを抽出して描画コマンド生成部33に伝達するとともに、原稿検知部14から入力された画像データ(2値化および低解像度化された画像データ)を文字認識部32に出力する。
文字認識部32は、情報抽出部31から入力された画像データに対して文字認識処理を行い、当該画像データに対応する画像に含まれる文字のテキストデータ(文字データ)を生成する。なお、文字認識処理の方法は特に限定されるものではなく、従来から公知の種々の方法を用いることができる。例えば、文字認識部32は、画像データに基づいて当該画像データの特徴量を抽出し、抽出した特徴量と記憶部23に記憶している辞書データ(文字データベース)とを比較することで文字認識処理を行う。そして、文字認識結果に基づいて生成した文字データ(テキストデータ)を描画コマンド生成部33に出力する。なお、文字認識処理の方法は特に限定されるものではなく、従来から公知の種々の方法を用いることができる。
描画コマンド生成部33は、文字認識部32によって生成されたテキストデータに応じたテキスト画像を原稿の画像データにおける当該テキスト画像に対応する文字に応じた位置に表示させるためのテキストレイヤ情報(上記テキストデータに応じた透明テキストを示す透明テキストレイヤ、および上記テキストデータに応じた可視テキストを示す可視テキストレイヤ)を生成する。なお、透明テキストとは、上記テキストデータをテキスト情報として見掛け上は見えない形で画像データに重ね合わせる(あるいは埋め込む)ためのデータである。例えば、PDFファイルでは、原稿画像データに透明テキストを付加した画像ファイルが一般に使用されている。また、可視テキストとは、上記テキストデータに応じた文字画像をユーザが視認することのできる色で表示させるためのデータである。
また、描画コマンド生成部33は、後段のフォーマット化処理部34で生成される画像ファイルに埋め込む描画コマンドを生成する。描画コマンドとは、画像ファイルの画像を表示装置に表示させる際の表示条件、画像ファイルに含まれる画像データに対して適用すべき画像処理条件、画像ファイルの画像を印刷装置で印刷する際の印刷条件などを表示処理や印刷処理を行うコンピュータに対して指示するためのコマンドである。なお、簡易送信モードの場合、描画コマンド生成部33は、原稿の画像データに応じた画像を表示させる際に当該画像データに対して原稿検知部14の傾き角度検知結果および天地方向判定結果に応じた傾き補正処理および天地方向補正処理をコンピュータに実行させるためのコマンドを描画コマンドに含める。
フォーマット化処理部34は、中間調生成部20から入力された画像データ、描画コマンド生成部33によって生成されたテキストレイヤ情報(透明テキストおよび可視テキスト)、および描画コマンド生成部33によって生成された描画コマンドに基づいて所定のフォーマット(本実施形態ではPDFフォーマット)の画像ファイルを生成し、通信装置5に出力する。すなわち、フォーマット化処理部34は、画像データが含まれる画像レイヤ、透明テキストが含まれる透明テキストレイヤ、および可視テキストが含まれる可視テキストレイヤの各レイヤを含み、かつ描画コマンドが埋め込まれた画像ファイルを生成する。画像ファイルの詳細については後述する。
なお、本実施形態では、フォーマット化処理部34は、PDF形式(サーチャブルPDF形式)の画像ファイルを生成する。ただし、フォーマット化処理部34によって生成される画像ファイルのフォーマットはこれに限るものではなく、当該画像ファイルに含まれる描画コマンドに基づいて、コンピュータが、原稿の画像とテキストデータに応じて描画されるテキスト画像(透明テキストあるいは可視テキスト)とを表示させる第1表示状態と、画像データの画像を表示させずにテキストデータに応じて描画される可視画像を表示させる第2表示状態とに切り替える処理を行うことのできるフォーマットであればよい。
通信装置5は、フォーマット化処理部34から入力された画像ファイルを、ネットワークを介して通信可能に接続された外部装置に送信する。なお、フォーマット化処理部34が生成した画像ファイルを、通信ネットワークを介して接続された他の装置の記憶部、デジタルカラー複合機1内の記憶部、あるいはデジタルカラー複合機1に着脱可能に接続された各種記憶手段における所定の保存先に記憶させるようにしてもよい。
(5)描画コマンド
次に、画像ファイルに記述される(埋め込まれる)描画コマンドについてより詳細に説明する。
上述したように、描画コマンドとは、画像ファイルの画像を表示装置に表示させる際の表示条件、画像ファイルに含まれる画像データに対して適用すべき画像処理条件、画像ファイルの画像を印刷装置で印刷する際の印刷条件などを表示処理や印刷処理を行うコンピュータに対して指示するためのコマンドである。描画コマンドの記述形式は画像ファイルのフォーマットに応じた記述形式であればよく、特に限定されるものではないが、以下ではPDFファイルに埋め込む描画コマンドの例について説明する。
図5(b)は、画像ファイルに記述されているオプショナルコンテントグループ辞書であり、第1表示状態と第2表示状態とを切り替えるアクションを行う上で、相互の関連を整理するためのラベル(後述する図8参照)を定義するものである。図5(b)の例では、“13 0”という対象物(オブジェクト)に対して、原稿の画像および透明テキストを表示させる第1表示状態(通常表示)用の切替ラベル(ラベル名”Normal View”、タイプ”OCG”)が対応付けられている。また、”19 0”という対象物(オブジェクト)に対して、原稿の画像を表示させずに可視テキストを表示させる第2表示状態(文字認識結果表示)用の切替ラベル(ラベル名”OCR View”、タイプが”OCG”)が対応付けられている。
図5(a)は、画像ファイルに記述されている文書カタログであり、文書全体(原稿画像)の情報を表すものである。文書カタログは、表示切替を行う対象物に対して、ページ毎、対象物毎に設定される。図5(a)の例では、2つの対象物”13 0”および”19 0”の表示を行うことが示されており、初期状態では”13 0”という対象物が表示され、”19 0”という対象物は表示されないように設定されている。
図5(c)は、オプショナルコンテントの範囲指定に関する記述を示したものであり、ページ毎のコンテンツの情報を示している。図5(c)の例では、表示切替を行う対象物の範囲(第2表示状態用テキストレイヤ。可視テキスト)が設定されている。
図6(a)は第1表示状態(通常表示)用の描画コマンドの例を示している。この例では、原稿の画像データに応じた画像を描画すること、および当該原稿に対応するテキストデータの文字画像を透明色で描画することが規定されている。
図6(b)は、第2表示状態(文字認識結果表示)用の描画コマンドの例を示している。この例では、原稿に対応するテキストデータの文字画像を指定色(ここでは赤色)で描画することが規定されている。
図7(a)〜図7(c)は、表示切替ボタンの設定に関する記述の例を示している。図7(a)はアクション(表示状態の切り替え、リンク先への移動等)を起こす際の参照情報が記述されたページオブジェクトであり、図7(b)に示すWidget注釈にリンクされている。
図7(b)は、アクションを起こす対象物の説明を記述したWidget注釈の例を示している。図7(b)の例では、表示切替ボタンが操作されることにより、対象物“13 0”と“19 0”の表示を切り替えることが定義されている。また、図7(b)の例では、表示切替ボタンは印刷されない設定(デフォルト設定)になっている。また、Widget注釈は、図7(c)に示すフォームXObject(“44 0”)にリンクされている。
図7(c)は、表示切替ボタンの描画イメージを記述したフォーム(フォームXObject)の例を示している。
図8は、デジタルカラー複合機1によって生成された画像ファイルを表示装置に表示させる際の表示状態の切り替え方法を説明するための説明図である。また、図9(a)および図9(b)は、デジタルカラー複合機1から送信された画像ファイルに基づいて送信先のコンピュータの表示画面に表示される第1表示状態の表示画面の例、および第2表示状態の表示画面の例をそれぞれ示す説明図である。
図9(a)に示したように、第1表示状態では、原稿の画像およびこの原稿に対応するテキストデータの透明テキスト(透明テキスト画像)が表示される。また、第1表示状態では、表示画面の一部に表示切替ボタン700が表示される。
また、図9(b)に示したように、第2表示状態では、原稿の画像は表示されず、原稿に対応するテキストデータの可視テキスト(可視テキスト画像)が表示される。また、第2表示状態においても表示画面の一部に表示切替ボタン700が表示される。
第1表示状態または第2表示状態において表示切替ボタン700をユーザが操作すると、図7(b)に示したWidget注釈に基づいて表示切替動作が行われる。すなわち、第1表示状態(図9(a)参照)において表示切替ボタン700が操作された場合には、ラベル”OCR View”の表示、すなわち可視テキストの表示(第2表示状態、図9(b)参照)に切り替えられる。また、第2表示状態において表示切替ボタンが操作された場合には、ラベル”Normal View”の表示、すなわち原稿の画像および透明テキストの表示(第1表示状態)に切り替えられる。
なお、本実施形態ではファイル生成部30で生成された画像ファイルを表示装置に表示させる場合、初期状態において原稿の画像データと透明テキストとを重畳させた画像を表示させるようにしているが、これに限るものではない。例えば、初期状態において原稿の画像を表示させずに可視テキストを表示させ、ユーザの操作に応じて原稿の画像と透明テキストとを重畳させて表示する表示状態に切り替えるようにしてもよい。また、画像ファイルの初期状態における表示形態を、ユーザが任意に設定できるようにしてもよい。
また、本実施形態では、第1表示状態において原稿の画像と透明テキストとを表示し、第2表示状態において原稿の画像を表示させずに可視テキストを表示させるようにしているが、これに限るものではない。例えば、第1表示状態において原稿の画像と可視テキストとを表示し、第2表示状態において原稿の画像を表示させずに可視テキストを表示させるようにしてもよい。図10(a)〜図10(d)は、その場合の描画コマンドの一例を示す説明図である。また、図11は、図10(a)〜図10(d)の設定に基づいて行われる表示状態の切り替えを示す説明図である。
図10(a)は、文書カタログの例を示しており、対象物“19 0”(可視テキスト)は常に表示され、対象物“13 0”(原稿の画像)の表示が表示/非表示に表示切替される設定になっている。また、図10(b)は、対象物“13 0”用の描画コマンドの例を示している。図10(c)は、ページオブジェクトの例を示しており、第1表示状態において可視テキストレイヤの上に画像データレイヤが配置されるように設定されている。すなわち、第1表示状態では、可視テキストと原稿の画像とが重畳して表示されるように設定されている。図10(d)は、Widget注釈の例を示しており、対象物“13 0”の表示/非表示が切り替えられるように設定されている。
これにより、図11に示したように、第1表示状態および第2表示状態の両方において可視テキストレイヤは表示状態となるが、表示切替ボタンの操作により、ラベル”Normal View”に対応する原稿の画像の表示状態が表示状態と非表示状態とに切り替えられる。このように制御を行うことよって、原稿の画像の表示状態が表示状態の場合は、可視テキストレイヤは原稿の画像に隠れて見かけ上は原稿の画像のみが表示される第1表示状態となり、原稿の画像の表示状態が非表示状態の場合は、可視テキストレイヤのみが表示される第2表示状態となる。なお、図11に示す実施の形態では、可視テキストレイヤの上に原稿画像レイヤが形成される。
また、表示切替ボタンを半透明(例えば通常濃度の30%の濃度)で表示させておき、ユーザが所定の操作を行ったとき(例えばマウス等のポインティングデバイスの操作によりカーソルを表示切替ボタン上に移動させたとき)に表示切替ボタンの色を非透明な通常濃度で表示させたり、表示切替ボタンに対する注釈情報を表示させたりするようにしてもよい。図12(a)〜図12(c)は、その場合の描画コマンドの一例を示す説明図である。また、図13は、図12(a)〜図12(c)の設定に基づいて行われる表示切替ボタンの表示状態の切り替えを示す説明図である。
図12(a)は、Widget注釈の例を示しており、表示切替ボタンの操作により対象物“13 0”と対象物“19 0”の表示状態を切り替えることが規定されている。また、図12(a)の例では、表示切替ボタンは印刷されない設定(デフォルトの設定)になっている。また、図12(a)の例では、カーソルが表示切替ボタンの範囲外にあるときの表示切替ボタンの描画イメージ(ノーマル外観)を対象物”45 0”(半透明の描画イメージ)とすること、およびカーソルが表示切替ボタンの範囲内にあるときの表示切替ボタンの描画イメージ(ロールオーバー外観)を対象物”44 0”(非透明の描画イメージ、半透明時よりも表示濃度の高い描画イメージ)とすることが定義されている。また、図12(a)の例では、カーソルが表示切替ボタンの範囲内にあるときに、表示切替ボタンの機能(表示切替ボタンが操作されたときに行われる動作内容)を説明する吹き出し(説明画像)を表示切替ボタンの近傍に表示させることが定義されている。具体的には、“/TU”に続く“()”で囲まれた文字列、すなわちメッセージ”Turn on and off OCR Result”を表示させることが定義されている。なお、図12(a)に示したWidget注釈は、図12(b)に示す表示切替ボタンの半透明描画イメージを記述したフォーム、および表示切替ボタンの非透明描画イメージを記述したフォーム(図示せず)にリンクされている。
図12(b)は、表示切替ボタンの描画イメージ(外観)を記述したフォーム(フォームXObject)の例であり、ボタンの半透明描画イメージが定義されている。
図12(c)は、対象物の描画状態を規定するグラフィック状態パラメータ辞書の一例であり、半透明の描画状態を定義している。図12(c)に示した例では不透明度30%(透過率70%)の半透明状態に設定されている。
これにより、図13に示したように、カーソル800が表示切替ボタン700の範囲外にある状態では表示切替ボタン700が半透明で表示される。また、カーソル800が表示切替ボタン700の範囲内に移動すると、表示切替ボタン700が非透明(半透明時よりも表示濃度の高い表示状態)で表示され、表示切替ボタン700の近傍にメッセージ”Turn on and off OCR Result”を示す吹き出し900が表示される。表示切替ボタン700がクリックされた場合の動作は上述した通りである。
また、本実施形態では、表示切替ボタン700が表示されている状態でユーザが表示されている画像の印刷指示した場合に、表示切替ボタン700を印刷対象から除外して表示切替ボタン700を除く画像を印刷するものとしているが、これに限るものではない。例えば、印刷指示が入力されたときに、表示中の画像(原稿画像、可視テキスト、あるいはその両方)と表示切替ボタン700とを印刷させるようにしてもよい。図14は、その場合のWidget注釈の例を示す説明図である。この図に示すように、Widget注釈にコマンド“/F4”を挿入することにより、表示切替ボタン700が印刷される状態にすることができる。表示切替ボタン700を印刷させない場合には、図7(b)に示したように上記コマンド“/F4”を挿入しなければよい。
また、原稿画像が複数ページの画像からなる場合、表示中のページに対応して表示されている表示切替ボタンが操作されたときに、その表示切替ボタンの操作に対応する表示状態の切り替えを全ページに対して共通に適用するようにしてもよい。この場合、図15に示すように、各ページに関する第1表示状態の対象物および第2表示状態の対象物をページ毎に別々の対象物として定義するとともに、ラベルについてはページによらず共通のラベルを関連付けておけばよい。図15に示した例では、各ページの第1表示状態の対象物に”Normal View”を関連付け、各ページの第2表示状態の対象物には”OCR View”を関連付けている。
また、表示中のページに対応して表示されている表示切替ボタンが操作されたときに、その表示切替ボタンの操作に対応する表示状態の切り替えを当該ページにのみ適用し、他のページには適用しないようにしてもよい。この場合、図16に示すように、各ページに関する第1表示状態の対象物および第2表示状態の対象物をページ毎に別々の対象物として定義するとともに、ラベルについてもページ毎に異なるラベルを関連付けておけばよい。
(6)外部装置から画像データを入力する処理例
本実施形態では、画像入力装置2が原稿を読み取って取得した画像データに対して画像形成モードあるいは画像送信モードの処理を行う場合について記載しているが、これに限るものではない。例えば、デジタルカラー複合機1が、通信装置5によって外部装置から受信した画像ファイルやデジタルカラー複合機1に対して着脱可能に接続された各種メモリデバイス(例えばUSBメモリ等)から読み出した画像ファイルに基づいて画像形成モードや画像送信モードの処理を行う機能を有していてもよい。
この場合、制御部24は、処理対象の画像ファイルのファイルフォーマットを検出し、この画像ファイルにテキストデータが付加されているか否かを判断する。文字データが埋め込まれたファイルの例としては、例えばサーチャブルPDFなどが挙げられる。
制御部24は、処理対象の画像ファイルにテキストデータが埋め込まれていないと判断した場合、当該画像ファイルに含まれている画像データを抽出し、原稿検知部14およびフォーマット化処理部34に出力する。原稿検知部14は、上記画像データを低解像度化および2値化した2値化画像データを生成し、情報抽出部31に出力する。情報抽出部31は、原稿検知部14から入力された2値画像データを文字認識部32に伝達(スルー)し、文字認識部32は上記2値画像データに基づいて文字認識処理を行い、文字認識結果を描画コマンド生成部33に伝達する。描画コマンド生成部33およびフォーマット化処理部34は、上述した画像送信モードの処理と同様の処理を行い、画像データ、テキストデータ(透明テキストおよび可視テキスト)、および描画コマンドを含む画像ファイルを生成して通信装置5に出力する。
一方、処理対象の画像ファイルにテキストデータが埋め込まれていると判断した場合、制御部24は、処理対象の画像ファイルを情報抽出部31に出力する。情報抽出部31は画像ファイルを解析して画像データおよびテキストデータを抽出し、テキストデータを文字認識部32に伝達する。この場合、文字認識部32は、文字認識処理を行わず、情報抽出部31から伝達されたテキストデータをそのまま描画コマンド生成部33に伝達(スルー)する。また、情報抽出部31は、処理対象の画像ファイルから抽出した画像データをフォーマット化処理部34に伝達する。なお、情報抽出部31がテキストデータを描画コマンド生成部33に直接伝達するようにしてもよい。また、情報抽出部31が画像データを文字認識部32および描画コマンド生成部33を介してフォーマット化処理部34に伝達するようにしてもよい。また、制御部24が画像データを抽出してフォーマット化処理部34に入力するようにしてもよい。描画コマンド生成部33は、情報抽出部31が画像ファイルから抽出したテキストデータに基づいて描画コマンドを生成してフォーマット化処理部34に出力する。フォーマット化処理部34は、描画コマンド生成部33が生成した描画コマンドと情報抽出部31が画像ファイルから抽出した画像データとに基づいて、画像データ、テキストデータ(透明テキストおよび可視テキスト)画像ファイルを生成する。
図17は、制御部24にて実行されるファイルフォーマットの判定処理の一例を示すフローチャートである。図17に示した処理は、各種画像ファイルがファイル先頭部(ヘッダ)にファイルフォーマットに応じた特徴的なバイト列を有していることが多い点に着目し、ファイルの先頭部のバイト列を確認することにより、ファイル種別(フォーマット)を簡易的に認識するようにしたものである。
画像送信モードが選択され、かつ記憶部23に保存されている画像ファイル(あるいは通信装置5を介して通信可能に接続された外部装置に保存されている画像ファイル、またはデジタルカラー複合機1に対して着脱可能に接続された各種メモリデバイスに保存されている画像ファイル)が処理対象として選択されると、制御部24は、当該画像ファイルのファイル先頭部のバイト列を取得する(S21)。
S21にて取得されたバイト列が16進数の0×49,0×49,0×2A,0×00である場合(S22にてYES)、すなわち、ファイルが0×49,0×49,0×2A,0×00で始まっている場合、制御部24は、処理対象の画像ファイルのフォーマットがTIFFであると判断する(S26)。
また、S21にて取得されたバイト列が16進数の0×4D,0×4D,0×00,0×2Aである場合も(S22にてNO、S23にてYES)、制御部24は、処理対象の画像ファイルのフォーマットがTIFFであると判断する(S26)。
また、S21にて取得されたバイト列が16進数の0×FF,0×D8である場合(S22およびS23にてNO、S24にてYES)、制御部24は、処理対象の画像ファイルのフォーマットがJPEGであると判断する(S27)。
また、S21にて取得されたバイト列が16進数の0×25,0×50,0×44,0×46である場合(S22〜S24にてNO、S25にてYES)、制御部24は、処理対象の画像ファイルのフォーマットがPDFであると判断する(S28)。
これに対し、S21にて取得されたバイト列がS22〜S25に示されるいずれのバイト例にも該当しない場合(S22〜S25にてNO)、制御部24は、処理対象の画像ファイルが処理不可ファイルであると判定し(S29)、この場合については画像送信モードの処理を中止する。
制御部24は、図17の処理によって画像ファイルのフォーマットを特定すると、以下のようにしてテキストデータの有無を判断する。
まず、図17の処理によって特定されたフォーマットがPDFである場合、制御部24は、テキストコマンドを調べることで、PDFファイルにおけるテキストデータの有無を判断する。例えば、サーチャブルPDFのようにPDFにテキストデータが埋め込まれているファイルフォーマットでは、図5(c)に示されるようにPDFファイル内部に”stream BT 84 Tz …”のような記述があるため、テキストデータ(文字データ)が埋め込まれていると判断できる。一方、文字情報がビットマップ画像としてPDFファイルに格納されている場合(テキストデータを有しない場合)、上記のような記述は含まれていないため、テキストデータが埋め込まれていないと判断できる。
また、図17の処理によって特定されたフォーマットがJPEGの場合、制御部24は、テキストデータを有していない画像ファイルとして認識する。
また、図17の処理によって特定されたフォーマットがTIFFの場合も、制御部24は、テキストデータを有していない画像ファイルとして認識する。ただし、この場合、制御部24は、TIFFファイルのタグを調べることで、TIFFファイルが2値画像および多値画像のいずれであるかを判定する。そして、TIFFファイルが多値画像である場合、制御部24は、TIFFファイルに含まれている画像データを抽出してRGBの画像データに変換し、原稿補正部15を介して当該画像データをファイル生成部30に出力する。これに対し、TIFFファイルが2値画像である場合、制御部24は、TIFFファイルに含まれている2値画像を抽出し、2値画像を多値のRGBの画像データ(例えば8ビットの画像データ)に変換する。そして、変換したRGBの画像データを、原稿補正部15を介してファイル生成部30に出力する。
なお、図17に示した処理例では、処理対象の画像ファイルがワード、エクセル、パワーポイント等の電子データの場合について記載されていないが、これらの電子データもテキストデータを含むため、処理対象の画像ファイルがこれらの電子データである場合、制御部24は、当該電子データをファイル生成部30に入力するようになっている。
(7)画像読取装置
また、本実施形態では、本発明をカラー複合機(画像形成装置)に適用する場合について説明したが、これに限らず、モノクロ複合機に適用してもよい。また、複合機(画像形成装置)に限らず、例えばカラーあるいはモノクロの画像読取装置に適用してもよい。
図18は、本発明をカラー画像読取装置に適用する場合の構成例を示すブロック図である。図18に示すように、画像読取装置100は、画像入力装置2、画像処理装置3b、通信装置5、および操作パネル6を備えている。画像入力装置2、通信装置5、および操作パネル6の構成および機能は上述したデジタルカラー複合機1の場合と略同様なので、ここではその説明を省略する。
画像処理装置3bは、A/D変換部11、シェーディング補正部12、入力処理部13、原稿検知部14、原稿補正部15、ファイル生成部30を備えている。ファイル生成部30の構成は上述したデジタルカラー複合機1の画像処理装置3に備えられるファイル生成部30と同様である。また、画像入力装置2、画像処理装置3bに含まれる各部の処理内容は、デジタルカラー複合機1の場合と略同様である。画像処理装置3bにおいて上記各処理が施された後の画像ファイルはコンピュータやハードディスク、ネットワークなどへ出力される。
(8)プログラム
また、上記実施形態において、デジタルカラー複合機1に備えられる各部(各ブロック)、特に画像処理装置3の各部を、CPU等のプロセッサを用いてソフトウェアによって実現してもよい。この場合、デジタルカラー複合機1は、各機能を実現する制御プログラムの命令を実行するCPU(central processing unit)、上記プログラムを格納したROM(read only memory)、上記プログラムを展開するRAM(random access memory)、上記プログラムおよび各種データを格納するメモリ等の記憶装置(記録媒体)などを備えている。そして、本発明の目的は、上述した機能を実現するソフトウェアであるデジタルカラー複合機1の制御プログラムのプログラムコード(実行形式プログラム、中間コードプログラム、ソースプログラム)をコンピュータで読み取り可能に記録した記録媒体を、デジタルカラー複合機1に供給し、そのコンピュータ(またはCPUやMPU)が記録媒体に記録されているプログラムコードを読み出し実行することによって達成される。
上記記録媒体としては、例えば、磁気テープやカセットテープ等のテープ系、フロッピー(登録商標)ディスク/ハードディスク等の磁気ディスクやCD−ROM/MO/MD/DVD/CD−R等の光ディスクを含むディスク系、ICカード(メモリカードを含む)/光カード等のカード系、あるいはマスクROM/EPROM/EEPROM(登録商標)/フラッシュROM等の半導体メモリ系などを用いることができる。
また、デジタルカラー複合機1を通信ネットワークと接続可能に構成し、通信ネットワークを介して上記プログラムコードを供給してもよい。この通信ネットワークの構成は特に限定されるものではなく、例えば、インターネット、イントラネット、エキストラネット、LAN、ISDN、VAN、CATV通信網、仮想専用網(virtual private network)、電話回線網、移動体通信網、衛星通信網等が利用可能である。また、通信ネットワークを構成する伝送媒体についても特に限定されず、例えば、IEEE1394、USB、電力線搬送、ケーブルTV回線、電話線、ADSL回線等の有線でも、IrDAやリモコンのような赤外線、Bluetooth(登録商標)、802.11無線、HDR、携帯電話網、衛星回線、地上波デジタル網等の無線でも利用可能である。なお、本発明は、上記プログラムコードが電子的な伝送で具現化された、搬送波に埋め込まれたコンピュータデータ信号の形態でも実現され得る。
また、デジタルカラー複合機1の各ブロックは、ソフトウェアを用いて実現されるものに限らず、ハードウェアロジックによって構成されるものであってもよい。また、デジタルカラー複合機1の各ブロックは、処理の一部を行うハードウェアと当該ハードウェアの制御や残余の処理を行うソフトウェアを実行する演算手段とを組み合わせたものであってもよい。
本発明は上述した各実施形態に限定されるものではなく、請求項に示した範囲で種々の変更が可能であり、異なる実施形態にそれぞれ開示された技術的手段を適宜組み合わせて得られる実施形態についても本発明の技術的範囲に含まれる。
本発明は、原稿の画像データと上記原稿のテキストデータとを含む画像ファイルを生成する画像処理装置に適用できる。
1 デジタルカラー複合機(画像処理装置、画像形成装置、画像読取装置)
2 画像入力装置
3,3b 画像処理装置
4 画像出力装置
5 通信装置
6 操作パネル
14 原稿検知部
15 原稿補正部
23 記憶部
24 制御部
30 ファイル生成部
31 情報抽出部(文字情報取得部)
32 文字認識部(文字情報取得部)
33 描画コマンド生成部
34 フォーマット化処理部
51 信号変換部
52 解像度変換部
53 2値化処理部
54 原稿傾き検知部
55 天地方向検知部
100 画像読取装置(画像処理装置)
700 表示切替ボタン
800 カーソル

Claims (10)

  1. 画像ファイルに含まれるデータに対してコンピュータに実行させる処理の処理内容を示す描画コマンドを生成する描画コマンド生成部と、
    原稿の画像データ、上記原稿に含まれる文字のテキストデータ、および、上記描画コマンド生成部が生成した描画コマンドを含む所定フォーマットの画像ファイルを生成するフォーマット化処理部とを備えた画像処理装置であって、
    上記描画コマンド生成部は、上記原稿の画像を表示装置に表示させる第1表示状態と、上記原稿の画像を表示させずに上記テキストデータの文字をユーザが視認できる色で配置した可視テキストを表示装置に表示させる第2表示状態との切り替えをコンピュータに実行させるためのコマンドを上記描画コマンドに含めることを特徴とする画像処理装置。
  2. 上記描画コマンド生成部は、上記第1表示状態において、上記テキストデータの文字をユーザが視認できない色で配置した透明テキストを上記原稿の画像に重畳させて表示装置に表示させるためのコマンドを上記描画コマンドに含めることを特徴とする請求項1に記載の画像処理装置。
  3. 上記原稿に含まれる文字のテキストデータを取得する文字情報取得部を備え、
    上記文字情報取得部は、
    上記原稿の画像データに対して文字認識処理を行うことで上記テキストデータを取得するか、あるいは、上記原稿の画像データに予め付加されているテキストデータを抽出することで上記テキストデータを取得することを特徴とする請求項1または2に記載の画像処理装置。
  4. 上記描画コマンド生成部は、ユーザが上記第1表示状態と上記第2表示状態との切り替えの指示入力を行うための操作対象となる表示切替ボタンを表示装置に表示させる処理をコンピュータに実行させるためのコマンド、およびユーザから上記画像ファイルの印刷指示がなされた場合に上記表示切替ボタンを除いた画像を印刷する処理をコンピュータに実行させるためのコマンドを上記描画コマンドに含めることを特徴とする請求項1から3のいずれか1項に記載の画像処理装置。
  5. 上記描画コマンド生成部は、上記原稿が複数ページからなる場合に、上記表示切替ボタンを上記原稿の各ページの画像に対応する位置にそれぞれ表示させ、かつユーザが上記表示切替ボタンを用いて上記第1表示状態と上記第2表示状態との切り替えの指示入力を行った場合に当該指示入力に対応する上記第1表示状態と上記第2表示状態との切り替え処理を原稿の全ページに対して共通に適用することを特徴とする請求項4に記載の画像処理装置。
  6. 上記描画コマンド生成部は、
    初期状態では上記表示切替ボタンに重畳する位置に表示される他の画像をユーザが視認できるように上記表示切替ボタンを半透明で表示し、ユーザによる所定の操作が行われた場合に上記表示切替ボタンの表示濃度を上記初期状態よりも高める処理をコンピュータに実行させるためのコマンドを上記描画コマンドに含めることを特徴とする請求項4または5に記載の画像処理装置。
  7. 上記描画コマンド生成部は、
    上記所定の操作が行われた場合に、上記表示切替ボタンの近傍に当該表示切替ボタンを操作することによって入力される指示内容を示す画像を表示させる処理をコンピュータに実行させるためのコマンドを上記描画コマンドに含めることを特徴とする請求項6に記載の画像処理装置。
  8. 請求項1から7のいずれか1項に記載の画像処理装置を備えていることを特徴とする画像形成装置。
  9. 請求項1から7のいずれか1項に記載の画像処理装置を動作させるプログラムであって、コンピュータを上記各部として機能させるためのプログラム。
  10. 請求項9に記載のプログラムを記録したコンピュータ読み取り可能な記録媒体。
JP2012110045A 2012-05-11 2012-05-11 画像処理装置、画像形成装置、プログラムおよびその記録媒体 Pending JP2013238933A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2012110045A JP2013238933A (ja) 2012-05-11 2012-05-11 画像処理装置、画像形成装置、プログラムおよびその記録媒体
PCT/JP2013/062270 WO2013168590A1 (ja) 2012-05-11 2013-04-25 画像処理装置、画像形成装置、および記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2012110045A JP2013238933A (ja) 2012-05-11 2012-05-11 画像処理装置、画像形成装置、プログラムおよびその記録媒体

Publications (1)

Publication Number Publication Date
JP2013238933A true JP2013238933A (ja) 2013-11-28

Family

ID=49550636

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012110045A Pending JP2013238933A (ja) 2012-05-11 2012-05-11 画像処理装置、画像形成装置、プログラムおよびその記録媒体

Country Status (2)

Country Link
JP (1) JP2013238933A (ja)
WO (1) WO2013168590A1 (ja)

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006085509A (ja) * 2004-09-16 2006-03-30 Fuji Xerox Co Ltd ドキュメント管理装置
JP5376795B2 (ja) * 2007-12-12 2013-12-25 キヤノン株式会社 画像処理装置、画像処理方法、そのプログラム及び記憶媒体
JP2011008549A (ja) * 2009-06-25 2011-01-13 Sharp Corp 画像処理装置、画像読取装置、複合機、画像処理方法、プログラム、記録媒体
JP5482223B2 (ja) * 2010-01-22 2014-05-07 株式会社リコー 情報処理装置、情報処理方法
JP2012073749A (ja) * 2010-09-28 2012-04-12 Kyocera Mita Corp 画像形成装置及び画像形成プログラム

Also Published As

Publication number Publication date
WO2013168590A1 (ja) 2013-11-14

Similar Documents

Publication Publication Date Title
JP4772888B2 (ja) 画像処理装置、画像形成装置、画像処理方法、プログラムおよびその記録媒体
JP5972578B2 (ja) 画像処理装置、画像形成装置、プログラム、記録媒体
JP4927122B2 (ja) 画像処理方法、画像処理装置、画像形成装置、プログラムおよび記録媒体
JP5280425B2 (ja) 画像処理装置、画像読取装置、画像形成装置、画像処理方法、プログラムおよびその記録媒体
WO2014045788A1 (ja) 画像処理装置、画像形成装置、および記録媒体
JP4758502B2 (ja) 画像処理装置、画像読取装置、画像送信装置、画像形成装置、画像処理方法、プログラムおよびその記録媒体
JP2010146185A (ja) 画像処理装置、画像読取装置、画像送信装置、画像処理方法、プログラムおよびその記録媒体
JP2011008549A (ja) 画像処理装置、画像読取装置、複合機、画像処理方法、プログラム、記録媒体
US8670623B2 (en) Image processing apparatus, image conversion method, and computer-readable storage medium for computer program based on calculated degree of complexity
JP2012118863A (ja) 画像読取装置、画像形成装置、画像読取方法、プログラムおよびその記録媒体
JP2012074852A (ja) 画像処理装置、画像形成装置、画像読取装置、画像処理方法、画像処理プログラムおよび記録媒体
JP4582200B2 (ja) 画像処理装置、画像変換方法、およびコンピュータプログラム
US8274515B2 (en) Vector image generation method, image processing apparatus, and computer-readable storage medium for computer program
US9268998B2 (en) Image determining apparatus, image processing system, and recording medium
JP6860609B2 (ja) 画像処理装置、画像形成装置、コンピュータプログラム及び記録媒体
JP4710672B2 (ja) 文字色判別装置、文字色判別方法、およびコンピュータプログラム
JP2010287178A (ja) 画像処理装置、画像読取装置、複合機、画像処理方法、プログラム、記録媒体
WO2013168590A1 (ja) 画像処理装置、画像形成装置、および記録媒体
JP2014033439A (ja) 画像処理装置、画像形成装置、プログラム、および記録媒体
JP2010161745A (ja) 画像処理装置、画像読取装置、画像送信装置、画像形成装置、画像処理方法、プログラムおよびその記録媒体
JP2010273119A (ja) 画像処理装置、画像形成装置、画像処理方法、コンピュータプログラム及び記録媒体
JP2011010232A (ja) 画像処理装置、画像読取装置、複合機、画像処理方法、プログラムおよび記録媒体
JP6137998B2 (ja) 画像処理装置、画像形成装置、プログラムおよび記録媒体
JP2010286917A (ja) 画像処理装置、画像読取装置、複合機、画像処理方法、プログラムおよび記録媒体
JP2016178451A (ja) 画像処理装置、画像形成装置、コンピュータプログラム及び記録媒体