JP3899872B2 - 画像処理装置、画像処理方法ならびに画像処理プログラムおよびこれを記録したコンピュータ読み取り可能な記録媒体 - Google Patents

画像処理装置、画像処理方法ならびに画像処理プログラムおよびこれを記録したコンピュータ読み取り可能な記録媒体 Download PDF

Info

Publication number
JP3899872B2
JP3899872B2 JP2001254757A JP2001254757A JP3899872B2 JP 3899872 B2 JP3899872 B2 JP 3899872B2 JP 2001254757 A JP2001254757 A JP 2001254757A JP 2001254757 A JP2001254757 A JP 2001254757A JP 3899872 B2 JP3899872 B2 JP 3899872B2
Authority
JP
Japan
Prior art keywords
color
character
image data
area
represented
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2001254757A
Other languages
English (en)
Other versions
JP2003069843A (ja
Inventor
葉子 藤原
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Konica Minolta Business Technologies Inc
Original Assignee
Konica Minolta Business Technologies Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Konica Minolta Business Technologies Inc filed Critical Konica Minolta Business Technologies Inc
Priority to JP2001254757A priority Critical patent/JP3899872B2/ja
Publication of JP2003069843A publication Critical patent/JP2003069843A/ja
Application granted granted Critical
Publication of JP3899872B2 publication Critical patent/JP3899872B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Description

【0001】
【発明の属する技術分野】
本発明は、画像処理装置、画像処理方法ならびに画像処理プログラムおよびこれを記録したコンピュータ読み取り可能な記録媒体に関する。
【0002】
【従来の技術】
従来から、画像データに基づいて、文字画像を含む文字領域、図形画像を含む図形領域、および写真画像を含む写真領域を各々抽出する技術(「領域分離」と呼ばれる)が知られている。各領域を抽出することによって、領域の種類毎に異なる画像処理を実行することが可能となる。特に、文字領域内に含まれる文字画像がカラーで表されることが多くなっている現在、カラーで表された文字画像を含む文字領域における画像データを適切に処理する技術の重要性が増している。
【0003】
文字領域におけるカラー画像データを処理する技術として、以下のようにいくつかの画像処理技術が知られている。
【0004】
第1に、複数文字分の文字画像を含む文字領域におけるカラー画像データを二値化することによって得られる二値化画像データ(モノクロデータ)のみを記憶する方法が知られている。しかしながら、この方法では、記憶されたデータに基づいて文字画像を再現する際に、文字画像が、すべて黒色で再現されてしまう。したがって、当初の文字画像が黒色以外の色で表されていた場合には、まったく異なる色で文字画像が再現されてしまう。
【0005】
第2に、上記の二値化画像データとともに、複数文字分の文字画像を表すために使用されている色の平均値や代表値を色情報として記憶する。この方法によれば、文字領域内に含まれる複数文字分の文字画像が一色のみで表されている場合には、この一色が色情報として記憶されるために、色の再現性について問題は生じない。しかしながら、文字領域内に含まれる複数文字分の文字画像が複数の色で表されている場合には、文字画像が、これら複数の色の平均値や代表値などの一色で再現されてしまう。したがって、本来の複数の色で表されていた文字画像と再現された文字画像との間では、用いられている色の数および色の種類が異なる。
【0006】
第3の方法は、特開平11−298716号公報に開示されている。この公報に記載されている画像処理装置によれば、上記の二値化画像データとともに、一文字毎の色情報を記憶する。したがって、文字領域内に含まれる複数文字分の文字画像が一色のみで示されているか複数の色で示されているかによらず、忠実に色を再現することができる。しかしながら、第3の方法では、第2の方法に比べて、データ量が増加する。特に、文字領域内に含まれる複数文字分の文字画像が一つの色で表されている場合には、第3の方法のように、一文字毎に一つの色情報を記憶する必要はなく、第2の方法を採用して複数文字毎に一つの色情報を記憶すれば足りる。
【0007】
以上のように、上記の公報記載の技術では、文字領域内に含まれる複数文字分の文字画像が一つの色で表されている場合であっても、一文字毎に色情報を記憶するため、データ量が不必要に多くなってしまうといった問題がある。すなわち、上記の公報記載の技術によっては、文字画像の色再現性を保ちつつ、不必要なデータ量の増加を避けることが難しい。
【0008】
さらに、上記の公報記載の技術では、たとえばアルファベットの「S」の一文字が、赤と黒の二色で表されている場合のように、一文字が複数の色で表されている場合の処理が難しいといった問題がある。
【0009】
【発明が解決しようとする課題】
本発明は上記従来技術の有する問題点に鑑みなされたものであり、本発明の目的は、カラー画像データを処理する場合に、文字画像の色の再現性を保ちつつ、不必要なデータ量の増加を避けることができる画像処理装置、画像処理方法、および画像処理プログラムを提供することである。特に、本発明は、文字画像の色の再現性を保ちつつ、データ量の増加を最大限に防止することができる画像処理技術を提供すすることを目的とする。
【0010】
本発明の他の目的は、一文字が複数の色で表されている場合に、一文字としての文字画像の特徴を考慮して、適切に処理可能な画像処理装置、画像処理方法、および画像処理プログラムを提供することである。
【0011】
【課題を解決するための手段】
本発明の上記目的は、下記の手段によって達成される。
【0012】
(1)本発明の画像処理装置は、カラー画像データに基づいて複数文字分の文字画像を含む領域を抽出する領域抽出手段と、カラー画像データを二値化して二値化画像データを得る二値化手段と、抽出された領域内に含まれる複数文字分の文字画像が一つの色で表されているか複数の色で表されているかを判断する判断手段と、抽出された領域内に含まれる複数文字分の文字画像が一つの色で表されていると判断される場合、当該一つの色に関する色情報を検出する検出手段と、抽出された領域内に含まれる複数文字分の文字画像が一つの色で表されていると判断される場合、抽出された領域におけるカラー画像データを前記二値化手段によって二値化して得られる二値化画像データと前記領域において検出される前記色情報とを関連づけて記憶する記憶手段と、抽出された領域内に含まれる複数文字分の文字画像が複数の色で表されていると判断される場合、抽出された領域を当該領域よりもサイズが小さい複数の分割領域に分割する分割手段と、を有し、前記判断手段は、さらに、前記分割手段によって得られた一の分割領域内に含まれる文字画像が一つの色で表されているか複数の色で表されているかを判断し、前記分割手段によって得られた一の分割領域内に含まれる文字画像が一つの色で表されていると判断される場合、前記検出手段は、さらに、当該一つの色に関する色情報を検出するとともに、前記記憶手段は、前記一の分割領域におけるカラー画像データを前記二値化手段によって二値化して得られる二値化画像データと前記一の分割領域において検出される前記色情報とを関連づけて記憶する、ことを特徴とする。
【0014】
)上記の判断手段は、一の分割領域内に含まれる文字画像が複数の色で表されていると判断した場合、前記分割手段は、さらに、前記一の分割領域を当該分割領域よりもサイズが小さい新たな複数の分割領域に分割する。
【0015】
)上記の分割手段は、複数文字分の文字画像を含む領域を一文字単位に分割するものであり、前記判断手段が、一文字単位に領域を分割して得られた一の分割領域内に含まれる一文字分の文字画像が複数の色で表されていると判断する場合、前記記憶手段は、前記二値化画像データと前記色情報とを関連づけて記憶する代わりに、前記一の分割領域におけるカラー画像データを記憶する。
(4)上記の画像処理装置は、さらに、原稿を読み取って前記カラー画像データを得るための読取手段を有する。
【0016】
(5)本発明の画像処理装置は、カラー画像データに基づいて複数文字分の文字画像を含む領域を抽出する領域抽出手段と、カラー画像データを二値化して二値化画像データを得る二値化手段と、抽出された領域内に含まれる複数文字分の文字画像が一つの色で表されているか複数の色で表されているかを判断する判断手段と、抽出された領域内に含まれる複数文字分の文字画像が一つの色で表されていると判断される場合、当該一つの色に関する色情報を検出する検出手段と、抽出された領域内に含まれる複数文字分の文字画像が一つの色で表されていると判断される場合、抽出された領域におけるカラー画像データを前記二値化手段によって二値化して得られる二値化画像データと前記領域において検出される前記色情報とを関連づけて記憶する記憶手段と、前記記憶手段によって記憶された内容を含むデータファイルをネットワークを通じて他の機器へ出力するファイル出力手段と、
を有することを特徴とする。
【0018】
)本発明の画像処理方法は、カラー画像データに基づいて複数文字分の文字画像を含む領域を抽出するステップと、抽出された領域内に含まれる複数文字分の文字画像が一つの色で表されているか複数の色で表されているかを判断するステップと、抽出された領域内に含まれる複数文字分の文字画像が一つの色で表されていると判断される場合、当該一つの色に関する色情報を検出するステップと、抽出された領域内に含まれる複数文字分の文字画像が一つの色で表されていると判断される場合、抽出された領域におけるカラー画像データを二値化して得られる二値化画像データと前記領域において検出される前記色情報とを関連づけて記憶するステップと、抽出された領域内に含まれる複数文字分の文字画像が複数の色で表されていると判断される場合、抽出された領域を当該領域よりもサイズが小さい複数の分割領域に分割するステップと、を有し、前記判断するステップでは、さらに、前記分割によって得られた一の分割領域内に含まれる文字画像が一つの色で表されているか複数の色で表されているかを判断し、前記分割によって得られた一の分割領域内に含まれる文字画像が一つの色で表されていると判断される場合、前記検出するステップでは、さらに、当該一つの色に関する色情報を検出するとともに、前記記憶するステップでは、前記一の分割領域におけるカラー画像データを二値化して得られる二値化画像データと前記一の分割領域において検出される前記色情報とを関連づけて記憶する、ことを特徴とする。
(7)本発明の画像処理方法は、カラー画像データに基づいて複数文字分の文字画像を含む領域を抽出するステップと、抽出された領域内に含まれる複数文字分の文字画像が一つの色で表されているか複数の色で表されているかを判断するステップと、抽出された領域内に含まれる複数文字分の文字画像が一つの色で表されていると判断される場合、当該一つの色に関する色情報を検出するステップと、抽出された領域内に含まれる複数文字分の文字画像が一つの色で表されていると判断される場合、抽出された領域におけるカラー画像データを二値化して得られる二値化画像データと前記領域において検出される前記色情報とを関連づけて記憶するステップと、前記記憶された内容を含むデータファイルをネットワークを通じて他の機器へ出力するステップと、を有することを特徴とする。
【0019】
(8)本発明の画像処理プログラムは、カラー画像データに基づいて複数文字分の文字画像を含む領域を抽出する手順と、抽出された領域内に含まれる複数文字分の文字画像が一つの色で表されているか複数の色で表されているかを判断する手順と、抽出された領域内に含まれる複数文字分の文字画像が一つの色で表されていると判断される場合、当該一つの色に関する色情報を検出する手順と、抽出された領域内に含まれる複数文字分の文字画像が一つの色で表されていると判断される場合、抽出された領域におけるカラー画像データを二値化して得られる二値化画像データと前記領域において検出される前記色情報とを関連づけて記憶する手順と、抽出された領域内に含まれる複数文字分の文字画像が複数の色で表されていると判断される場合、抽出された領域を当該領域よりもサイズが小さい複数の分割領域に分割する手順と、をコンピュータに実行させる画像処理プログラムであって、前記判断する手順では、さらに、前記分割によって得られた一の分割領域内に含まれる文字画像が一つの色で表されているか複数の色で表されているかを判断し、前記分割によって得られた一の分割領域内に含まれる文字画像が一つの色で表されていると判断される場合、前記検出する手順では、さらに、当該一つの色に関する色情報を検出するとともに、前記記憶する手順では、前記一の分割領域におけるカラー画像データを二値化して得られる二値化画像データと前記一の分割領域において検出される前記色情報とを関連づけて記憶する、ことを特徴とする
(9)本発明の画像処理プログラムは、カラー画像データに基づいて複数文字分の文字画像を含む領域を抽出する手順と、抽出された領域内に含まれる複数文字分の文字画像が一つの色で表されているか複数の色で表されているかを判断する手順と、抽出された領域内に含まれる複数文字分の文字画像が一つの色で表されていると判断される場合、当該一つの色に関する色情報を検出する手順と、抽出された領域内に含まれる複数文字分の文字画像が一つの色で表されていると判断される場合、抽出された領域におけるカラー画像データを二値化して得られる二値化画像データと前記領域において検出される前記色情報とを関連づけて記憶する手順と、前記記憶された内容を含むデータファイルをネットワークを通じて他の機器へ出力する手順と、をコンピュータに実行させる。
【0020】
10)本発明のコンピュータ読み取り可能な記録媒体は、上記(8)または(9)の画像処理プログラムを記録したことを特徴とする。
【0021】
【発明の実施の形態】
以下、本発明の実施の形態を、図面を参照して詳細に説明する。
【0022】
図1は、本発明の第1の実施形態にかかる画像処理システムの全体構成を示すブロック図である。画像処理システムは、デジタル複写機100、コンピュータ200、およびプリンタ300を備える。デジタル複写機100は、ネットワーク400を介してコンピュータ200およびプリンタ300と通信可能に接続されている。
【0023】
デジタル複写機100は、カラー画像データを処理可能なデジタル複写機100である。デジタル複写機100は、カラー原稿を読み取って得られたカラー画像データに基づいて文字領域、写真領域、および図形領域を抽出し、各領域の種類毎に異なる画像処理を行う。この結果、デジタル複写機100は、所定の形式のデータファイルを作成する。作成されたファイルは、コンピュータ200へ出力される。このように、デジタル複写機100は、原稿を読み取って得られた画像データに基づいてファイルを作成し、作成したファイルをサーバ(たとえば、コンピュータ200)に出力する機能(スキャンtoサーバ機能)を有する。
【0024】
また、デジタル複写機100は、原稿を読み取って得られた画像データに基づいてプリントジョブをプリンタ300に送信する機能(スキャンtoプリント機能)を有する。デジタル複写機100は、もちろん、カラー原稿を読み取って得られた画像データに基づいて、自ら用紙上に印刷する複写機能を有する。さらに、図示していないが、デジタル複写機100は、原稿を読み取って得られた画像データに基づいて電子メールを作成し、作成した電子メールを送信する機能(スキャンtoEメール機能)を有していてもよい。
【0025】
以上のように、本実施の形態のデジタル複写機100は、複数の機能を持った複合機、すなわち、多機能周辺機器(MFP)として機能するものである。
【0026】
コンピュータ200は、デジタル複写機100から画像データのファイルを受信する。受信したファイル内の各領域別の画像データを用いて、さらに文字認識などの種々の画像処理を実行する。プリンタ300は、デジタル複写機200からプリントジョブを受信し、または、コンピュータ200からプリントジョブを受信することによって、用紙上にプリントアウトする。
【0027】
つぎに、上記各機器の構成について説明するが、各機器で同様の機能を有する部分については、説明の重複を避けるため初回のみその説明を行い、2回目以降はその説明を省略する。
【0028】
図2は、本実施形態にかかるデジタル複写機100の構成を示すブロック図である。デジタル複写機100は、CPU101、ROM102、RAM103、記憶部104、操作部105、ディスプレイ106、原稿読取部107、画像処理部108、印刷部109、およびインタフェース110を備えている。
【0029】
CPU101は、プログラムにしたがって上記各部の制御や各種の演算処理を行う。したがって、CPU101は、各部を制御するための制御部として機能する。しかしながら、本実施の形態と異なり、各部を制御するための制御用の論理ICからなる制御部をCPU101の他に設けてもよい。
【0030】
ROM102は、制御プログラムを記憶する。RAM103は、作業領域として後述するヒストグラムなどのデータを一時的に記憶する。記憶部104は、各種プログラムおよびパラメータを記憶する。さらに、記憶部104は、画像処理により得られた画像データおよび情報を記憶するためにも使用される。
【0031】
操作部105は、メカニカルキーおよびキーボードであり、デジタル複写機100において作成されたファイルの出力先、ファイルの形式、およびプリント条件、動作の開始および終了を指示するために用いられる。ディスプレイ106は、たとえば、液晶ディスプレイであり、プリント条件の設定内容などの各種の情報を表示する。
【0032】
原稿読取部107は、所定の読み取り位置にセットされた原稿に蛍光ランプ等の光源を用いて光を照射し、その反射光をCCDやCIS等の受光素子で光電変換して、その電気信号から画像データを生成する。本発明では、カラー画像データとしてRGB(赤緑青)で表現されたカラービットマップデータが得られる。原稿読取部107は、自動原稿搬送装置(ADF)を備えていてもよい。自動原稿搬送装置は、複数枚の原稿を一枚ずつ所定の読み取り位置まで搬送する。この結果、原稿が順次読み取られる。
【0033】
画像処理部108は、画像処理を実行するためのプロセッサであり、たとえば、画像処理用のDSP(デジタルシグナルプロセッサ)である。画像処理部108は、CPU101の制御を受けて、原稿を読み取って得られたカラー画像データに基づいて文字領域を抽出する領域抽出処理、カラー画像データを二値化して二値化画像データを取得する二値化処理、ヒストグラムを求める処理、および、色情報の検出処理など種々の画像処理を実行する。画像処理の内容については、後述する。
【0034】
印刷部109は、プリンタエンジンであり、画像処理後の画像データに基づいて、用紙上に印刷する。インタフェース110は、ネットワーク400に接続しネットワーク400上の他の機器と通信するためのインタフェースである。
【0035】
図3は、本実施形態にかかるコンピュータの構成の一例を示すブロック図である。図3において、コンピュータ200は、CPU201、ROM202、RAM203、記憶部204、操作部205、ディスプレイ206、およびインタフェース207を備える。
【0036】
CPU201は、制御と演算の各種処理を行う。ROM202は各種プログラムを記憶する。RAM203は作業領域として一時的にデータを記憶する。記憶部204は、ハードディスクなどの記録メディアであり、各種プログラムやデータを記憶する。操作部205は、キーボードやマウスなどのポインティングデバイスであり、各種の入力を行うために使用される。ディスプレイ206は、各種の表示を行う。インタフェース207は、ネットワーク400に接続しネットワーク400上の他の機器と通信するためのインタフェースである。
【0037】
コンピュータ200は、インタフェース207を介してデジタル複写機100からファイルを読み込む。そして、読み込んだファイルに含まれる文字画像データ、図形画像データ、写真画像データを夫々処理する。なお、具体的には、コンピュータ200は、文字領域に対応する文字画像データに対して文字認識処理を施する。その結果、コンピュータ200は、ビットマップデータで示された文字画像データを、たとえばASCIIコードなどの文字コードデータに変換する。同様に、ビットマップデータとして示された図形画像データをベクタデータに変換する。したがって、ビットマップデータとして示された文字画像データに基づいて文字認識処理するための文字認識用ソフトウエア、およびビットマップデータとして示された図形画像データをベクタデータへ変換するためのラスタ−ベクタ変換用ソフトウエアが記憶部204にインストールされている。
【0038】
プリンタ300は、プリントジョブが制御言語を含む場合はこれを解釈してラスタライズを行い、用紙上にプリントアウトする。プリンタ300の構成は、従来のプリンタと同様であるので、詳しい説明を省略する。
【0039】
つぎに、本実施形態における画像処理システムの動作の概要を説明する。
【0040】
図4は、図2に示されるデジタル複写機100の処理手順を示すフローチャートである。図4のフローチャートに示されるアルゴリズムは、画像処理プログラムとして、ROM102または記憶部104に記憶されており、CPU101および画像処理部108によって実行される。
【0041】
ステップS100では、RGB→YCbCr変換を実行する。RGB→YCbCr変換は、RGB(赤緑青)で表現されたカラー画像データから、明度Yと二つの色差Cr、Cbとで表現されたカラー画像データへの線形変換をいう。RGB→YCbCr変換の内容は、従来の処理と同様であるので、詳しい説明を省略する。
【0042】
ステップS101では、カラー画像データに基づいて文字領域を抽出する。そして、文字領域内に含まれる複数文字分の文字画像に対して、所定の処理を施す。このステップS101における一連の処理が、本発明の特徴的な処理である。ステップS101の処理の結果、文字画像データが作成される。文字画像データには、文字領域内に含まれる複数文字分の文字画像の色情報を含めることが可能となる。ここで、「文字画像」とは、文字を構成する画像を意味する。ステップS101の処理内容の詳細は、後述する。
【0043】
ステップS102では、カラー画像データから文字画像を除去する。この結果、除去した文字画像が存在していた部分は、背景の色で補完される。
【0044】
ステップS103では、写真領域と図形領域とが抽出される。なお、「写真領域」とは、写真画像を含む画像領域をいい、中間調濃度で比較的滑らかに表現された画像領域である。「図形領域」とは、線画図形などの図形画像を含む画像領域をいい、たとえば、コンピュータで作成された図である。
【0045】
写真領域と図形領域は、既存の方法を用いて分離することができる。たとえば、明度が連続的に変化している領域を写真領域とし、明度が離散的に変化している領域を図形領域とする。具体的には、輪郭線抽出などによってエッジ(輪郭線部分)を検出し、一定の方向に沿って、エッジ間における明度値とその出現度数とを示すヒストグラムが作成される。このヒストグラムの形状から、出現した明度値の連続性を示す特徴量が検出される。この検出された特徴量に基づいて、出現した明度値が連続的である場合には、このエッジに囲まれた領域は、写真領域として抽出される。一方、出現した明度値が連続的でない場合には、このエッジに囲まれた領域は、図形領域として抽出される。
【0046】
以上のように、ステップS101において文字領域が抽出され、ステップS103において写真領域と図形領域とが夫々抽出されることによって、領域分離が完了する。なお、写真領域と図形領域とは重ならない。一方、文字領域は、他の種類の領域と重なる場合がある。
【0047】
ステップS104、ステップS105、およびステップS106では、文字領域における文字画像データ、写真領域における写真画像データ、および図形領域における図形画像データに対して、領域種類に応じて、各領域種類に適した画像圧縮および付随する画像処理が実行される。
【0048】
具体的には、ステップS104では、ステップS101の処理によって得られた文字領域における文字画像データに対して、たとえば、MMR(Modified Modified Read)またはJBIC(Joint Bi-level Experts Group)として規定された圧縮処理が実行される。
【0049】
ステップS105では、写真領域における写真画像データを、解像度変換により元の状態よりも低い解像度に変換する。なお、解像度変換に代えて、スムージングフィルタ処理(円滑化処理)を実行してもよい。この結果、原稿の網点によるモアレの影響を除去できる。そして、解像度変換またはスムージング処理がされた写真画像データに対して、JPEG(Joint Photographic Experts Group)として規定された圧縮処理が実行される。
【0050】
ステップS106では、図形領域における図形画像データに対して、減色処理を実行する。減色処理によって、データ量を削減するとともに、階調変化のない均一色で表されていた部分の再現性を向上することができる。本来的には均一色で表されていた部分において、画像読み取り段階や原稿の網点の影響により、色むらが発生する場合がある。本ステップの減色処理によって、本来的には均一色で表されていた部分の色むらが除去され、均一色に戻る。そして、減色処理された図形画像データに対して、たとえば、Flateアルゴリズムを用いて圧縮処理が実行される。Flateアルゴリズムとは、gzipおよびzipなどのファイル形式で採用されている圧縮用のアルゴリズムである。
【0051】
ステップS107では、YCbCr→RGB変換を実行し、各領域の画像データをRGBで表現された画像データに戻す。
【0052】
ステップS108では、ステップS104〜ステップS106において圧縮された文字画像データ、写真画像データ、および図形画像データを合成して、1つのファイルを作成する。本実施の形態では、合成して得られるファイルの形式として、PDF(Portable Document Format)を採用する。しかしながら、本実施の形態と異なり、合成して得られるファイルの形式として、PDF以外のファイル形式を採用することができる。また、ユーザが複数のファイル形式のうちから希望するファイル形式を指定することができるように構成することもできる。
【0053】
ステップS109では、ステップS108で得られたファイルを出力先であるコンピュータ200へ出力する。
【0054】
次に、コンピュータ200の処理手順を説明する。図5は、図3に示されるコンピュータ200の処理手順を示すフローチャートである。図5のフローチャートに示されるアルゴリズムは、画像処理プログラムとして、ROM202または記憶部204に記憶されており、CPU201によって実行される。
【0055】
ステップS200では、デジタル複写機200から出力されたファイルを受信する。ファイルは、インタフェース207を介して記憶部204内に読み込まれる。受信したファイルには、文字画像データ、写真画像データ、および図形画像データが別々に記憶されている。なお、各データは、基本的には、ビットマップデータである。
【0056】
ステップS201およびステップS202では、圧縮して記憶されている文字画像データおよび図形画像データを伸張する。
【0057】
ステップS203では、文字画像データに基づいて、文字認識処理を実行する。文字認識処理には、通常のOCRソフトウエアで用いられている処理と同様の処理を適用することができるので、詳しい処理内容の説明は省略する。この結果、ビットマップデータ形式の文字画像データは、ASCIIコードなどの文字コードに変換される。なお、この場合であっても、上述した文字画像データに含まれる色情報は保持される。したがって、最終的には、文字コードと色情報とからなる文字画像データが作成される。
【0058】
ステップS204では、ラスタ−ベクタデータが実行され、ベクタデータ形式の図形画像データが作成される。
【0059】
ステップS205では、文字領域における文字コードおよび色情報とからなる文字画像データと、写真領域におけるビットマップデータ形式の写真画像データと、図形領域におけるベクタデータ形式の図形画像データと、が合成される。こ結果、最終的な合成データファイルが作成され、記憶部204内に記憶される。
【0060】
図6、図7、および図8は、本実施の形態におけるデータの出力例を示す。図6は、文字画像データの出力例を示し、図7は、図形画像データの出力例を示し、図8は、写真画像データの出力例を示す。
【0061】
コンピュータ200が文書閲覧用のサーバであれば、各ユーザは、作成された合成データファイルにアクセス可能となり、各ユーザの間でデータの共有化を推進することができる。
【0062】
以上のように、本実施の形態における画像処理システムの動作の概要を説明したが、本発明の特徴的な点は、図4のステップS101に示されるデジタル複写機の処理にある。以下、この図4のステップS101の処理を詳細に説明する。
【0063】
図9および図10は、図4のステップS101のサブルーチンを示すフローチャートである。
【0064】
ステップS300では、原稿を読み取って得られたカラー画像データに基づいて複数文字分の文字画像を含む文字領域を抽出する。本実施の形態では、画像データを微小領域に分けて、微小領域毎に画像データを周波数成分に分解する。各微小領域において、文字画像に特有な周波数を検出することによって、この微小領域が文字画像を含むものか否かを判別する。文字画像を含むと判別された複数の微小領域が所定の距離内に隣接して存在する場合には、隣接する複数の微小領域を連結する連結処理を実行する。ここで、所定の距離は、上述した微小領域の連結処理を実行する範囲を定める。なお、周波数成分への分解は、通常の離散コサイン変換(DCT)で用いられている処理と同様であるので、詳しい説明は省略する。
【0065】
図11は、カラー画像データに基づいて抽出された複数文字分の文字領域の一例を示す。一つの矩形が一つの文字領域に対応する。図11に示されるように、1ページ分のカラー画像データに基づいて、複数の文字領域を抽出することができる。図11に示される場合では、抽出される一つの文字領域のサイズは、単語単位程度に設定されている。しかしながら、本発明は、この場合に限られず、単語単位よりも広い範囲(たとえば行単位またはページ単位程度)を一つの文字領域として抽出することもできる。換言すれば、上述した微小領域の連結処理を実行する範囲、すなわち上記した所定の距離を適宜変更することによって、抽出される文字領域のサイズを変更することができる。具体的には、上記の所定距離を長くすることによって、抽出される文字領域の一つあたりのサイズは、拡大する。
【0066】
図9のステップS301では、複数の文字領域のうちから一つの領域を選択する。つぎに、ステップS302では、文字領域におけるカラー画像データを二値化して二値化画像データを得る。ここで、「文字領域におけるカラー画像データ」とは、入力されたカラー画像データのうち、この文字領域に対応する部分についてのみ抜き出したデータである。なお、この二値化処理の過程で、文字領域内に含まれる文字画像と背景とが分離される。すなわち、文字画像データを作成する上で背景が不要であるので、背景が除去される。背景を除去するためには、たとえば、文字画像と背景との明度の差が用いられる。
【0067】
まず、文字領域ごとに、出現する明度値とその出現度数とが検出される。具体的には、各明度値とその出現度数との関係を示すヒストグラムが作成される。この結果、ヒストグラムには、文字画像に対応する出現度数のピークと背景に対応する出現度数のピークとが現れる。背景が占める面積は文字画像が占める面積に比べて大きいため、より大きい出現度数のピークが背景に対応する。この結果、より大きい出現度数のピークを示す明度値を背景の明度値Ybgとし、小さい出現度数のピークを示す明度値を文字画像の明度値Ychとする。
【0068】
背景の明度値Ybgが文字画像の明度値Ychよりも高い場合には、背景の明度値Ybgから所定値k(kは正数)を引いた値(Ybg−k)を閾値とする。この閾値(Ybg−k)よりも高い明度値を示す画素については、背景を構成する画素であるとして、値を0とし、この閾値(Ybg−k)以下の明度値を示す画素については、文字画像を構成する画素(「文字画素」という)であるとして、値を1とする。
【0069】
一方、背景の明度値Ybgが文字画像の明度値Ychよりも低い場合には、背景の明度値Ybgに所定値k(kは正数)を加えた値(Ybg+k)を閾値とする。この閾値(Ybg+k)よりも低い明度値を示す画素については、背景を構成する画素であるとして、値を0とし、この閾値(Ybg+k)以上の明度値を示す画素については、文字画素であるとして、値を1とする。以上の処理の結果、文字領域においてカラー画像データが二値化されて、二値化画像データが得られる。
【0070】
二値化処理によって得られる二値化画像データは、それぞれの画素が文字画素を構成する画素であるか否かを一画素あたり1ビットの情報(1または0)で示した画像データであり、一般には、1ビット画像データまたは1ビットBMP(1ビットビットマップデータ)と呼ばれる。
【0071】
この二値化画像データは、マスクとして用いることができる。具体的には、カラー画像データの全体から、文字画像部分のカラー画像データを取り出すためのマスクとして使用することができる。すなわち、カラー画像データのうちで、文字画素におけるデータのみを有効とすることによって、文字画像部分のカラー画像データを取り出すことができる。
【0072】
ステップS303では、上述のように、二値化画像データをマスクとして用いることによって取り出された文字画像部分のカラー画像データについて、減色処理を実行する。本実施の形態では、Y,Cr,Cbの各8ビットのカラー画像データを夫々5ビットのデータに変換する。この結果、文字画像のエッジ部分の色のばらつきや、網点による影響を防止することができる。なお、減色処理を実行する場合であっても、Cr,Cbの各8ビットのカラー画像データは、後続する処理のために必要であるので、RAM103または記憶部104に格納したまま維持される。
【0073】
ステップS304では、明度Y、色差Cr、および色差Cbのヒストグラムを作成する。明度Yを例にとって説明すると、一つの文字領域毎に明度値Y(0〜31の32段階で示される)とその出現度数Hist[Y]とを検出する。ステップS304の処理において、上述のように、背景部分が除去された文字画像部分のカラー画像データに基づいて、ヒストグラムが作成されるため、背景の色は、ヒストグラムに影響を与えない。
【0074】
図12は、文字領域とこの文字領域における明度Yのヒストグラムの一例を示す。図12(A)に示される文字領域内には、「total」という複数文字分の文字画像が含まれており、この文字画像は、黒一色で表されている。
【0075】
図12(B)は、図12(A)に示される文字画像部分のカラー画像データに基づいて作成された、各明度値とその出現度数との関係を示すヒストグラムである。
【0076】
同様に、図13および図14は、他の文字領域とこの他の文字領域における明度Yのヒストグラムについての一例を示す。
【0077】
図13(A)に示される文字領域内には、「red」という複数文字分の文字画像が含まれており、この文字画像は、赤一色で表されている。図13(B)は、図13(A)に示される文字画像部分のカラー画像データに基づいて作成された、各明度値とその出現度数との関係を示すヒストグラムである。
【0078】
図14(A)に示される文字領域内には、「stage2」という複数文字分の文字画像が含まれており、この文字画像は、黒と赤という複数の色で表されている。具体的には、「stage」とうい部分は黒色で表されており、「2」という部分は赤色で表されている。図14(B)は、図14(A)に示される文字画像部分のカラー画像データに基づいて作成された、各明度値とその出現度数との関係を示すヒストグラムである。なお、色差CrおよびCbについてのヒストグラムの同様に作成される。
【0079】
ステップS305では、ヒストグラムを用いて、色分布幅を算出する。本実施の形態では、「色分布幅」は、所定の閾値(第1閾値)以上の出現度数を示す明度値(一般的には、明度値のみならず、色差Cr,Cbも含むので、画素値)の分布範囲を意味する。好ましくは、「色分布幅」は、所定の閾値以上の出現度数を示す明度値のうちで最も高い明度値と最も低い明度値との差として定義される。図12に示される場合であれば、第1閾値以上の出現度数を示す明度値は、4、5、6、および7であるから、色分布幅は、3(=7−4)である。同様に、図13および図14に示される場合、色分布幅は、それぞれ2(=17−15)、12(=16−4)である。なお、色差CrおよびCbについての色分布幅も同様に算出される。
【0080】
ステップS306では、ヒストグラムに現れているピークの数を検出する。本実施の形態では、簡便な方法として、明度(一般には画素値)に対する出現度数の変化量(傾き)が所定値以上であるか否かによってピークを検出する。すなわち、ヒストグラムにおける出現度数Nの変化量を計算して、各明度値とその出現度数の変化量との関係を示す第2のヒストグラムを作成する。具体的には、Hist2[i]=Hist[i]−(Hist[i−2]+Hist[i+2])/2という計算式をもちいて、各明度値とその出現度数の変化量を計算する。ここで、iは、明度値(一般には、画素値)を示す。Hist2[i]は、明度値iにおける出現度数の変化量を示す。なお、本実施の形態では、明度値iが、0、1、30、31の場合、i−2またはi+2の値が存在しないため、出現度数の変化量の計算を実行しない。また、出現度数の変化量Hist2[i]が負の値となる場合には、すべて0としている。
【0081】
図15は、図14(A)に示される文字画像部分のカラー画像データに基づいて作成された、明度値とその出現度数の変化量の関係を示す第2のヒストグラムである。横軸は、各明度値を示し、縦軸は、出現度数の変化量を示す。
【0082】
所定値(第2閾値)以上の出現度数の変化量を示す明度の群(グループ)の数を検出する。この明度の群の数をピークの数とすることができる。図15に示される例の場合、第2閾値以上の出現度数変化量を示す明度の群が2つ存在するので、ピークの数は、2である。なお、色差CrおよびCbのヒストグラムに現れるピークの数についても同様に検出することができる。
【0083】
なお、他の方法を用いて、ピークの数を検出することもできる。また、ステップS305とステップS306の処理順序は、適宜変更することができる。
【0084】
ステップS307およびステップS308では、文字領域に含まれる複数文字分の文字画像が一つの色で表されているか複数の色で表されているかを判断する。本実施の形態では、ステップS305で算出された色分布幅およびステップS306で検出されたピークの数に基づいて、文字領域に含まれる複数文字分の文字画像が一つの色で表されているか複数の色で表されているかを判断する。
【0085】
ステップS307では、ステップS305で算出された色分布幅、すなわち明度Y、色差Cr、およびCbのそれぞれの色分布幅が、所定の閾値(第3閾値)未満であるか否かが判断される。色分布幅が、第3閾値未満である場合には(ステップS307:YES)、さらに、ステップS308の処理が実行される。
【0086】
ステップS308では、明度Y、色差Cr、および色差Cbの各ヒストグラムに現れるピークの数がそれぞれ一つであるか否かが判断される。
【0087】
ステップS307およびステップS308における処理の結果、明度Y、色差Cr、色差Cbについての色分布幅が第3閾値未満であり、かつ、検出されたピークの数が1である場合には(ステップS307:YES、かつ、ステップS308:YES)、文字領域内に含まれる複数文字分の文字画像が一つの色で表されていると判断される。この結果、ステップS309およびステップS310の処理が実行される。
【0088】
一方、色分布幅が第3閾値以上であるか(ステップS307:NO)、または検出されたピークの数が複数である場合には(ステップS308:NO)、文字領域内に含まれる複数文字分の文字画像が複数の色で表されていると判断される。この結果、ステップS311の処理が実行される。
【0089】
なお、ステップS307とステップS308の処理の順序は、適宜変更することができる。
【0090】
(文字画像が一つの色で表されていると判断される場合)
文字領域内に含まれる複数文字分の文字画像が一つの色で表されていると判断される場合、まず、ステップS309において、この一つの色に関する色情報を検出する。文字画像部分のカラー画像データに基づいて作成されたヒストグラムにおいて、もっとも出現度数の高い画素値(すなわち明度Y,および色差Cb,Cr)を求め、これを色情報とすることができる。明度Y,および色差Cb,Crで表現された色情報を、さらに、YCbCr→RGB変換にすることによって、RGBで表現された色情報を求めることもできる。また、減色処理していない各8ビットのカラー画像データに基づいて、色情報を検出することもできる。この場合には、合計24ビットの色情報が検出される。本実施の形態と異なり、出現度数の高い画素値に代えて、画素値の最小値または平均値を色情報として検出することもできる。
【0091】
ステップS310では、文字領域においてカラー画像データを二値化して得られた二値化画像データ(1ビット画像データ)と上記の色情報を関連づけて記憶する。換言すれば、二値化画像データと色情報とが関連づけられたデータを、この文字領域における文字画像データとして記憶する。
【0092】
(文字画像が複数の色で表されていると判断される場合)
一方、文字領域内に含まれる複数文字分の文字画像が複数の色で表されていると判断される場合、ステップS311の処理が実行される。
【0093】
ステップS311では、一文字単位に文字領域を分割ずみか否かが判断される。一文字単位に文字領域を分割していない状態では(ステップS311:NO)、ステップS312の処理が実行される。
【0094】
ステップS312では、文字領域の分割処理が実行される(ステップS312)。ここで、文字領域の分割処理とは、一つの文字領域を、この文字領域よりもサイズが小さい複数の分割領域に分割する処理である。本実施の形態では、抽出された単語単位程度の文字領域を一文字単位の分割領域に分割する。
【0095】
図16は、図14(A)に示される文字領域を分割した例を示す。図16に示される例では、「stage2」という複数文字分の文字画像を含む文字領域が、「S」、「t」、「a」、「g」、「e」、および「2」という一文字単位の6つの分割領域に分割される。複数の分割領域への分割処理は、種々の方法を用いて実現することができる。
【0096】
簡便な方法としては、文字列に垂直方向の線分(たとえば、図16における線分aや線分b)に沿って、画素値のヒストグラムを求める。この結果、文字画像と重なっていない線分bが検出される。この線分bを用いて、文字領域を分割することができる。なお、文字列に垂直な方向とは、英文のように横書きの文字列の場合には縦方向であり、縦書きの文字列の場合には、横方向である。
【0097】
また、他の方法としては、図9のステップS300で説明した連結処理と同様の手法によって分割領域を抽出することもできる。より具体的には、一文字程度の距離内に隣接して存在する複数の微小領域を連結し、連結して得られた連結部分毎に、ラベリングすることによって、一文字単位に分割された分割領域を求めることができる。
【0098】
ステップS313では、分割により得られた各分割領域を選択して、夫々の領域毎に、先に説明したステップS304〜ステップS308と同様の処理が実行される。具体的には、分割処理によって得られた一の分割領域内に含まれる文字画像が一つの色で表されているか複数の色で表されているかを判断する。
【0099】
分割処理によって得られた一の分割領域内に含まれる文字画像が一の色で表されていると判断される場合(ステップS307:YES,かつステップS308:YES)、ステップS309において、この一の色に関する色情報を検出する(ステップS309)。そして、この分割領域におけるカラー画像データを二値化して得られる二値化画像データ(1ビット画像データ)と色情報とを関連づけて記憶する。
【0100】
一方、分割処理によって得られた一の分割領域内に含まれる文字画像が複数の色で表されていると判断される場合(ステップS307:NO,またはステップS308:NO)、ステップS311の処理が実行される。
【0101】
すでに、一文字単位に文字領域を分割ずみの場合(ステップS311:YES)、ステップS314の処理が実行される。
【0102】
ステップS314では、一文字単位に分割して得られた分割領域内に含まれる一文字分の文字画像が複数の色で表されていると判断される場合の処理として、二値化画像データと色情報とを関連づけて記憶する代わりに、この分割領域における二値化されていないカラー画像データ(たとえば、24ビットのビットマップデータ)をこの分割領域における文字画像データとして記憶する。このように、一文字単位に分割して得られた分割領域内に含まれる一文字分の文字領域が複数の色で表されていると判断される場合には、さらに、領域を分割することなく、カラー画像データをそのまま記憶する。
【0103】
図17は、一文字分の文字画像「S」が、赤色(斜線部)と黒色という複数の色で表されている場合の例を示す。たとえば、飾り文字の場合には、一文字分の文字画像が複数の色で表される場合がある。この場合は、一文字毎に一つの色情報を検出したのでは、色の再現性に問題が生じる一方、文字コードに変換する際の最小単位であるため、領域を分割するのも問題であるため、カラー画像データをそのまま記憶する。
【0104】
ステップS315では、すべての文字領域について処理が完了したか否かを判断し、すべての文字領域について処理が完了していない場合には(ステップS315:NO)、図9のステップS301に戻り、別の文字領域を選択し、同様の処理を繰り返す。すべての文字領域について処理が完了した場合には(ステップS315:YES)、図9および図10に示した一連の処理が完了した場合として、リターンする。
【0105】
このように、本実施の形態によれば、文字領域内に含まれる複数文字分の文字画像が一つの色で表されているか否かを判断し、文字画像が一つの色で表されていると判断される場合、この一つの色に関する色情報を検出し、文字画像を二値化して得られた二値化画像データと色情報とを関連づけた文字画像データとして記憶する。一方、文字画像が複数の色で表されていると判断される場合、文字領域をさらにサイズが小さい複数の分割領域に分割し、同様の処理を繰り返し実行する。なお、記憶された文字画像データを内容に含む合成データファイルが作成され、作成された合成データファイルは、コンピュータ200へ出力される。
【0106】
したがって、本実施の形態によれば、記憶された文字画象データに基づいて文字画象を再現する場合における文字画像の色の再現性を保ちつつ、データ量が不必要に増加してしまうことを防止することができる。
【0107】
以上のように、本発明の好適な実施の形態について説明したが、本発明は、この実施の形態に限られず、発明の思想の範囲内で、種々の変形、省略、および追加をすることができる。
【0108】
たとえば、上記の説明では、YCrCbで表現されたカラー画像データに対して処理を実行しているが、本発明は、この場合に限られない。たとえば、RGBまたはLabなどの形式で表現されたカラー画像データに対して、処理を実行することもできる。
【0109】
また、上記の説明では、単語単位程度の文字領域を抽出し、必要に応じて、この文字領域を一文字単位の分割領域に分割しているが、抽出する文字領域のサイズ、および分割領域のサイズは、この場合に限られない。
【0110】
また、抽出された文字領域を、一段階の分割処理によって一文字単位の分割領域に分割するのではなく、複数段階の分割領域を経て、最終的に一文字単位の分割領域に分割することもできる。すなわち、文字領域を分割して得られた一の分割領域内に含まれる複数文字分の文字画像が複数の色で表されていると判断される場合には、さらに、この分割領域をサイズの小さい新たな複数の分割領域に分割することも可能である。
【0111】
たとえば、一ページ程度のサイズの文字領域を抽出し、この文字領域内に存在する文字画像が一つの色で表されていないと判断される場合、一行程度のサイズの分割領域に分割し、さらに、必要に応じて、単語程度のサイズの分割領域や一文字単位の分割領域に分割することもできる。このように、複数文字分の文字画像を含む領域を段階的に分割する処理は、図9のステップS300で説明したように、文字画像を含む微小領域の連結処理を実行する範囲、具体的には上記の所定の距離を変更することによって、実現できる。すなわち、所定の距離を段階的に短くすることによって、連結の範囲が狭くなり、一つの分割領域の範囲が、ページ単位、一行単位、単語単位、文字単位というように、適宜変更される。この結果を利用して、一の文字領域を段階的に分割することが可能となる。
【0112】
また、データ量の削減の見地からは、上述したように、一の文字領域内に含まれる複数文字分の文字画像が複数の色で表されていると判断される場合、この文字領域を複数の分割領域に分割することが望ましい。しかしながら、本発明は、この場合に限られず、一の文字領域内に含まれる複数文字分の文字画像が複数の色で表されていると判断される場合、その文字領域におけるカラー画像データを文字画像データとして記憶する処理を採用することができる。この場合であっても、一の文字領域内に含まれる複数文字分の文字画像が複数の色で表されているか否かを判断するステップを実行するため、データ量の削減に寄与することができる。
【0113】
また、以上の説明では、複数の文字領域における色情報が互いに同じ場合であっても、文字領域毎に色情報を記憶するが、本発明は、この場合に限られない。たとえば、同じ色情報を持つ複数の文字領域を最終的に統合することができる。
【0114】
以上の説明では、文字認識(ステップS203)、ラスタベクタ変換(ステップS204)、および最終的な合成データファイルの作成(ステップS205)について、コンピュータ200が実行する場合を説明したが、文字認識機能やラスタベクタ変換機能をデジタル複写機100が備えている場合には、かかる処理についても、デジタル複写機100で実行することができる。
【0115】
さらに、以上の説明では、本発明の画像処理装置をデジタル複写機に適用した場合を説明したが、本発明は、この場合に限られない。抽出した文字領域内に含まれる文字画像が一つの色で表されているか複数の色で表されているかを判断し、一つの色で表されていると判断される場合に、この文字領域におけるカラー画像データを二値化して得られる二値化画像と一つの色に関する色情報とを関連づけて記憶する機能を有する機器であれば、スキャナ、プリンタ、およびコンピュータなどのいかなる機器に対して、本発明を適用することができる。
【0116】
本発明による画像処理装置および画像処理方法は、上記図9および図10に示される各手順を実行するための専用のハードウエア回路によっても、また、上記各手順を記述した所定のプログラムをCPUが実行することによっても実現することができる。後者により本発明を実現する場合、画像処理装置を動作させる上記所定のプログラムは、フレキシブルディスクやCD−ROM等のコンピュータ読取可能な記録媒体によって提供されてもよいし、インターネット等のネットワークを介してオンラインで提供されてもよい。この場合、コンピュータ読取可能な記録媒体に記録されたプログラムは、通常、ROMやハードディスク等に転送され記憶される。また、このプログラムは、たとえば、単独のアプリケーションソフトとして提供されてもよいし、画像処理装置の一機能としてその装置のソフトウエアに組み込んでもよい。としてその装置のソフトウエアに組み込んでもよい。
【0117】
【発明の効果】
上述したように、本発明によれば、文字領域内に含まれる複数文字分の文字画像が一つの色で表されていると判断される場合、文字領域におけるカラー画像データを二値化して得られた二値化画像と一つの色に関する色情報とを関連づけて記憶する。したがって、本発明によれば、カラー画像データを処理する場合に、文字画像の色の再現性を保ちつつ、不必要なデータ量の増加を避けることができる新規の画像処理技術を提供することができる。
【0118】
また、本発明によれば、抽出された文字領域内に含まれる複数文字分の文字画像が複数の色で表されていると判断される場合、文字領域をサイズが小さい複数の分割領域に分割し、さらに、分割領域内に含まれる文字画像が一つの色で表されているか否かを判断するので、文字画像の色の再現性を保ちつつ、データ量の増加を最大限に防止することができる。
【0119】
さらに、本発明によれば、一文字分の文字画像が複数の色で表されていると判断される場合には、一文字分の画像の結合性を考慮して、分割処理を行うことなく、二値化していないカラー画像データを記憶するように処理する。したがって、一文字分の画像について適切な処理を実行することができる。
【図面の簡単な説明】
【図1】 本発明の実施形態にかかる画像処理システムの全体構成を示すブロック図である。
【図2】 図1におけるデジタル複写機の構成を示すブロック図である。
【図3】 図1におけるコンピュータの構成を示すブロック図である。
【図4】 図2に示されるデジタル複写機の処理手順を示すフローチャートである。
【図5】 図3に示されるコンピュータの処理手順を示すフローチャートである。
【図6】 本実施の形態における文字画像データの出力例を示すフローチャートである。
【図7】 本実施の形態における図形画像データの出力例を示すフローチャートである。
【図8】 本実施の形態における写真画像データの出力例を示すフローチャートである。
【図9】 図4のステップS101のサブルーチンを示すフローチャートである。
【図10】 図9に後続するフローチャートである。
【図11】 抽出された複数文字分の文字領域の一例を示す図である。
【図12】 黒色一色で表された文字画像を含む文字領域と、この文字領領域における明度のヒストグラムを示す図である。
【図13】 赤一色で表された文字画像を含む文字領域と、この文字領領域における明度のヒストグラムを示す図である。
【図14】 黒と赤で表された文字画像を含む文字領域と、この文字領領域における明度のヒストグラムを示す図である。
【図15】 14(A)に示される文字領域における明度値とその出現度数の変化量を示す第2のヒストグラムを示す図である。
【図16】 図14(A)に示される文字領域を一文字単位に分割して得られた分割領域の一例である。
【図17】 一文字分の文字画像が複数の色で表されている場合の例を示す図である。
【符号の説明】
100…デジタル複写機、
101…CPU、
102…ROM、
103…RAM、
104…記憶部、
105…操作部、
106…ディスプレイ、
107…原稿読取部、
108…画像処理部、
109…印刷部、
110…インタフェース、
200…コンピュータ、
300…プリンタ。
400…ネットワーク。

Claims (10)

  1. カラー画像データに基づいて複数文字分の文字画像を含む領域を抽出する領域抽出手段と、
    カラー画像データを二値化して二値化画像データを得る二値化手段と、
    抽出された領域内に含まれる複数文字分の文字画像が一つの色で表されているか複数の色で表されているかを判断する判断手段と、
    抽出された領域内に含まれる複数文字分の文字画像が一つの色で表されていると判断される場合、当該一つの色に関する色情報を検出する検出手段と、
    抽出された領域内に含まれる複数文字分の文字画像が一つの色で表されていると判断される場合、抽出された領域におけるカラー画像データを前記二値化手段によって二値化して得られる二値化画像データと前記領域において検出される前記色情報とを関連づけて記憶する記憶手段と、
    抽出された領域内に含まれる複数文字分の文字画像が複数の色で表されていると判断される場合、抽出された領域を当該領域よりもサイズが小さい複数の分割領域に分割する分割手段と、を有し、
    前記判断手段は、さらに、前記分割手段によって得られた一の分割領域内に含まれる文字画像が一つの色で表されているか複数の色で表されているかを判断し、
    前記分割手段によって得られた一の分割領域内に含まれる文字画像が一つの色で表されていると判断される場合、前記検出手段は、さらに、当該一つの色に関する色情報を検出するとともに、前記記憶手段は、前記一の分割領域におけるカラー画像データを前記二値化手段によって二値化して得られる二値化画像データと前記一の分割領域において検出される前記色情報とを関連づけて記憶する、
    ことを特徴とする画像処理装置。
  2. 前記判断手段は、一の分割領域内に含まれる文字画像が複数の色で表されていると判断した場合、前記分割手段は、さらに、前記一の分割領域を当該分割領域よりもサイズが小さい新たな複数の分割領域に分割することを特徴とする請求項に記載の画像処理装置。
  3. 前記分割手段は、複数文字分の文字画像を含む領域を一文字単位に分割するものであり、前記判断手段が、一文字単位に領域を分割して得られた一の分割領域内に含まれる一文字分の文字画像が複数の色で表されていると判断する場合、前記記憶手段は、前記二値化画像データと前記色情報とを関連づけて記憶する代わりに、前記一の分割領域におけるカラー画像データを記憶することを特徴とする請求項に記載の画像処理装置。
  4. さらに、原稿を読み取って前記カラー画像データを得るための読取手段を有することを特徴とする請求項2に記載の画像処理装置。
  5. カラー画像データに基づいて複数文字分の文字画像を含む領域を抽出する領域抽出手段と、
    カラー画像データを二値化して二値化画像データを得る二値化手段と、
    抽出された領域内に含まれる複数文字分の文字画像が一つの色で表されているか複数の色で表されているかを判断する判断手段と、
    抽出された領域内に含まれる複数文字分の文字画像が一つの色で表されていると判断される場合、当該一つの色に関する色情報を検出する検出手段と、
    抽出された領域内に含まれる複数文字分の文字画像が一つの色で表されていると判断される場合、抽出された領域におけるカラー画像データを前記二値化手段によって二値化して得られる二値化画像データと前記領域において検出される前記色情報とを関連づけて記憶する記憶手段と、
    前記記憶手段によって記憶された内容を含むデータファイルをネットワークを通じて他の機器へ出力するファイル出力手段と、
    を有することを特徴とする画像処理装置。
  6. カラー画像データに基づいて複数文字分の文字画像を含む領域を抽出するステップと、
    抽出された領域内に含まれる複数文字分の文字画像が一つの色で表されているか複数の色で表されているかを判断するステップと、
    抽出された領域内に含まれる複数文字分の文字画像が一つの色で表されていると判断される場合、当該一つの色に関する色情報を検出するステップと、
    抽出された領域内に含まれる複数文字分の文字画像が一つの色で表されていると判断される場合、抽出された領域におけるカラー画像データを二値化して得られる二値化画像データと前記領域において検出される前記色情報とを関連づけて記憶するステップと、
    抽出された領域内に含まれる複数文字分の文字画像が複数の色で表されていると判断される場合、抽出された領域を当該領域よりもサイズが小さい複数の分割領域に分割するステップと、を有し、
    前記判断するステップでは、さらに、前記分割によって得られた一の分割領域内に含まれる文字画像が一つの色で表されているか複数の色で表されているかを判断し、
    前記分割によって得られた一の分割領域内に含まれる文字画像が一つの色で表されていると判断される場合、前記検出するステップでは、さらに、当該一つの色に関する色情報を検出するとともに、前記記憶するステップでは、前記一の分割領域におけるカラー画像データを二値化して得られる二値化画像データと前記一の分割領域において検出される前記色情報とを関連づけて記憶する、
    ことを特徴とする画像処理方法。
  7. カラー画像データに基づいて複数文字分の文字画像を含む領域を抽出するステップと、
    抽出された領域内に含まれる複数文字分の文字画像が一つの色で表されているか複数の色で表されているかを判断するステップと、
    抽出された領域内に含まれる複数文字分の文字画像が一つの色で表されていると判断される場合、当該一つの色に関する色情報を検出するステップと、
    抽出された領域内に含まれる複数文字分の文字画像が一つの色で表されていると判断される場合、抽出された領域におけるカラー画像データを二値化して得られる二値化画像データと前記領域において検出される前記色情報とを関連づけて記憶するステップと、
    前記記憶された内容を含むデータファイルをネットワークを通じて他の機器へ出力するステップと、
    を有することを特徴とする画像処理方法。
  8. カラー画像データに基づいて複数文字分の文字画像を含む領域を抽出する手順と、
    抽出された領域内に含まれる複数文字分の文字画像が一つの色で表されているか複数の色で表されているかを判断する手順と、
    抽出された領域内に含まれる複数文字分の文字画像が一つの色で表されていると判断される場合、当該一つの色に関する色情報を検出する手順と、
    抽出された領域内に含まれる複数文字分の文字画像が一つの色で表されていると判断される場合、抽出された領域におけるカラー画像データを二値化して得られる二値化画像データと前記領域において検出される前記色情報とを関連づけて記憶する手順と、
    抽出された領域内に含まれる複数文字分の文字画像が複数の色で表されていると判断される場合、抽出された領域を当該領域よりもサイズが小さい複数の分割領域に分割する手順と、をコンピュータに実行させる画像処理プログラムであって、
    前記判断する手順では、さらに、前記分割によって得られた一の分割領域内に含まれる文字画像が一つの色で表されているか複数の色で表されているかを判断し、
    前記分割によって得られた一の分割領域内に含まれる文字画像が一つの色で表されていると判断される場合、前記検出する手順では、さらに、当該一つの色に関する色情報を検出するとともに、前記記憶する手順では、前記一の分割領域におけるカラー画像データを二値化して得られる二値化画像データと前記一の分割領域において検出される前記色情報とを関連づけて記憶する、
    ことを特徴とする画像処理プログラム。
  9. カラー画像データに基づいて複数文字分の文字画像を含む領域を抽出する手順と、
    抽出された領域内に含まれる複数文字分の文字画像が一つの色で表されているか複数の色で表されているかを判断する手順と、
    抽出された領域内に含まれる複数文字分の文字画像が一つの色で表されていると判断される場合、当該一つの色に関する色情報を検出する手順と、
    抽出された領域内に含まれる複数文字分の文字画像が一つの色で表されていると判断される場合、抽出された領域におけるカラー画像データを二値化して得られる二値化画像データと前記領域において検出される前記色情報とを関連づけて記憶する手順と、
    前記記憶された内容を含むデータファイルをネットワークを通じて他の機器へ出力する手順と、
    をコンピュータに実行させる画像処理プログラム。
  10. 請求項8または請求項9に記載の画像処理プログラムを記録したことを特徴とするコンピュータ読み取り可能な記録媒体。
JP2001254757A 2001-08-24 2001-08-24 画像処理装置、画像処理方法ならびに画像処理プログラムおよびこれを記録したコンピュータ読み取り可能な記録媒体 Expired - Fee Related JP3899872B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2001254757A JP3899872B2 (ja) 2001-08-24 2001-08-24 画像処理装置、画像処理方法ならびに画像処理プログラムおよびこれを記録したコンピュータ読み取り可能な記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001254757A JP3899872B2 (ja) 2001-08-24 2001-08-24 画像処理装置、画像処理方法ならびに画像処理プログラムおよびこれを記録したコンピュータ読み取り可能な記録媒体

Publications (2)

Publication Number Publication Date
JP2003069843A JP2003069843A (ja) 2003-03-07
JP3899872B2 true JP3899872B2 (ja) 2007-03-28

Family

ID=19082870

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001254757A Expired - Fee Related JP3899872B2 (ja) 2001-08-24 2001-08-24 画像処理装置、画像処理方法ならびに画像処理プログラムおよびこれを記録したコンピュータ読み取り可能な記録媒体

Country Status (1)

Country Link
JP (1) JP3899872B2 (ja)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4329564B2 (ja) * 2004-02-19 2009-09-09 富士ゼロックス株式会社 画像処理装置
JP4396331B2 (ja) * 2004-03-10 2010-01-13 富士ゼロックス株式会社 画像処理装置
JP4507656B2 (ja) * 2004-03-18 2010-07-21 富士ゼロックス株式会社 画像処理装置
JP4329764B2 (ja) 2006-01-17 2009-09-09 コニカミノルタビジネステクノロジーズ株式会社 画像処理装置および罫線抽出プログラム
JP4424309B2 (ja) 2006-01-23 2010-03-03 コニカミノルタビジネステクノロジーズ株式会社 画像処理装置、文字判定プログラム、および文字判定方法
JP4089736B2 (ja) 2006-05-26 2008-05-28 コニカミノルタビジネステクノロジーズ株式会社 画像処理装置、画像処理方法及び画像処理プログラム
JP4135752B2 (ja) 2006-06-12 2008-08-20 コニカミノルタビジネステクノロジーズ株式会社 画像処理装置、画像処理方法及び画像処理プログラム
JP4808267B2 (ja) * 2009-05-27 2011-11-02 シャープ株式会社 画像処理装置、画像形成装置、画像処理方法、コンピュータプログラム及び記録媒体
CN113744140A (zh) * 2020-10-16 2021-12-03 北京沃东天骏信息技术有限公司 一种图像处理方法、设备和计算机可读存储介质

Also Published As

Publication number Publication date
JP2003069843A (ja) 2003-03-07

Similar Documents

Publication Publication Date Title
US8384964B2 (en) Image processing apparatus and image processing method
US8503036B2 (en) System and method of improving image quality in digital image scanning and printing by reducing noise in output image data
JP5540553B2 (ja) 画像処理装置、画像形成装置、画像処理方法及び画像処理プログラム
JP4115460B2 (ja) 画像処理装置およびその方法、並びに、コンピュータプログラムおよび記録媒体
KR100994644B1 (ko) 화상 처리 장치 및 그 방법
JP5219706B2 (ja) 画像処理装置、画像処理方法、及び、画像処理プログラム
US8395813B2 (en) Subtractive color method, subtractive color processing apparatus, image forming apparatus, and computer-readable storage medium for computer program
EP1871088A2 (en) Method and appparatus for image processing
JP2007060619A (ja) 画像処理装置、画像圧縮方法、画像圧縮プログラム及び記録媒体
JP2009065571A (ja) 画像照合装置、画像照合方法、画像データ出力処理装置、プログラム、及び記録媒体
JP2017175213A (ja) 原稿種認識装置、画像形成装置、原稿種認識方法およびプログラム
US7672008B2 (en) Image processing device, method and program product for separating character, halftone graphic, and halftone photographic regions
JP2008141681A (ja) 画像処理装置、画像処理方法及び画像処理のプログラム
JP3899872B2 (ja) 画像処理装置、画像処理方法ならびに画像処理プログラムおよびこれを記録したコンピュータ読み取り可能な記録媒体
JPH11238130A (ja) カラーイメージから非テキスト情報の除去
JP6705237B2 (ja) 画像圧縮装置、画像形成装置、画像圧縮方法およびプログラム
JP4035456B2 (ja) 画像圧縮方法、画像圧縮装置
JP2010146218A (ja) 画像処理装置、画像処理方法、コンピュータプログラム
US20090083318A1 (en) Device adaptively switching image processes in accordance with characteristic of object included in image
JP4487003B2 (ja) 画像データ出力処理装置、画像データ出力処理方法、プログラム及び記録媒体
JP2009296218A (ja) 領域判別方法、画像圧縮方法、画像圧縮装置、およびコンピュータプログラム
JP2009060474A (ja) 画像処理装置
JP2003219187A (ja) 画像処理方法及び画像処理装置
JP4569162B2 (ja) 画像処理方法、画像処理プログラムおよび画像処理装置
JP3899800B2 (ja) 画像処理装置、画像処理方法および画像処理プログラムを記録したコンピュータ読取可能な記録媒体

Legal Events

Date Code Title Description
A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A712

Effective date: 20040423

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060228

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20060228

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060919

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20061110

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20061205

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20061218

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110112

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120112

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130112

Year of fee payment: 6

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees