JP2003069843A - 画像処理装置、画像処理方法ならびに画像処理プログラムおよびこれを記録したコンピュータ読み取り可能な記録媒体 - Google Patents

画像処理装置、画像処理方法ならびに画像処理プログラムおよびこれを記録したコンピュータ読み取り可能な記録媒体

Info

Publication number
JP2003069843A
JP2003069843A JP2001254757A JP2001254757A JP2003069843A JP 2003069843 A JP2003069843 A JP 2003069843A JP 2001254757 A JP2001254757 A JP 2001254757A JP 2001254757 A JP2001254757 A JP 2001254757A JP 2003069843 A JP2003069843 A JP 2003069843A
Authority
JP
Japan
Prior art keywords
color
character
area
image data
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2001254757A
Other languages
English (en)
Other versions
JP3899872B2 (ja
Inventor
Yoko Fujiwara
葉子 藤原
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Minolta Co Ltd
Original Assignee
Minolta Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Minolta Co Ltd filed Critical Minolta Co Ltd
Priority to JP2001254757A priority Critical patent/JP3899872B2/ja
Publication of JP2003069843A publication Critical patent/JP2003069843A/ja
Application granted granted Critical
Publication of JP3899872B2 publication Critical patent/JP3899872B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Image Analysis (AREA)
  • Image Processing (AREA)
  • Facsimile Image Signal Circuits (AREA)
  • Color Image Communication Systems (AREA)

Abstract

(57)【要約】 【課題】 文字画像の色の再現性を保ちつつ、不必要な
データ量の増加を避けることができる形式でカラー画像
データを処理する画像処理装置を提供する。 【解決手段】 CPU101および画像処理部108
は、原稿読取部107が原稿を読み取ることによって得
られたカラー画像データに基づいて、複数文字分の文字
画像を含む文字領域を抽出する。さらに、抽出された文
字領域内に含まれる文字画像が一つの色で表されている
か複数の色で表されているかを判断する。そして、文字
領域内に含まれる文字画像が一つの色で表されていると
判断される場合、この一つの色に関する色情報を検出
し、文字領域におけるカラー画像データを二値化して得
られた二値化画像データと検出された色情報とを関連づ
けて記憶する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、画像処理装置、画
像処理方法ならびに画像処理プログラムおよびこれを記
録したコンピュータ読み取り可能な記録媒体に関する。
【0002】
【従来の技術】従来から、画像データに基づいて、文字
画像を含む文字領域、図形画像を含む図形領域、および
写真画像を含む写真領域を各々抽出する技術(「領域分
離」と呼ばれる)が知られている。各領域を抽出するこ
とによって、領域の種類毎に異なる画像処理を実行する
ことが可能となる。特に、文字領域内に含まれる文字画
像がカラーで表されることが多くなっている現在、カラ
ーで表された文字画像を含む文字領域における画像デー
タを適切に処理する技術の重要性が増している。
【0003】文字領域におけるカラー画像データを処理
する技術として、以下のようにいくつかの画像処理技術
が知られている。
【0004】第1に、複数文字分の文字画像を含む文字
領域におけるカラー画像データを二値化することによっ
て得られる二値化画像データ(モノクロデータ)のみを
記憶する方法が知られている。しかしながら、この方法
では、記憶されたデータに基づいて文字画像を再現する
際に、文字画像が、すべて黒色で再現されてしまう。し
たがって、当初の文字画像が黒色以外の色で表されてい
た場合には、まったく異なる色で文字画像が再現されて
しまう。
【0005】第2に、上記の二値化画像データととも
に、複数文字分の文字画像を表すために使用されている
色の平均値や代表値を色情報として記憶する。この方法
によれば、文字領域内に含まれる複数文字分の文字画像
が一色のみで表されている場合には、この一色が色情報
として記憶されるために、色の再現性について問題は生
じない。しかしながら、文字領域内に含まれる複数文字
分の文字画像が複数の色で表されている場合には、文字
画像が、これら複数の色の平均値や代表値などの一色で
再現されてしまう。したがって、本来の複数の色で表さ
れていた文字画像と再現された文字画像との間では、用
いられている色の数および色の種類が異なる。
【0006】第3の方法は、特開平11−298716
号公報に開示されている。この公報に記載されている画
像処理装置によれば、上記の二値化画像データととも
に、一文字毎の色情報を記憶する。したがって、文字領
域内に含まれる複数文字分の文字画像が一色のみで示さ
れているか複数の色で示されているかによらず、忠実に
色を再現することができる。しかしながら、第3の方法
では、第2の方法に比べて、データ量が増加する。特
に、文字領域内に含まれる複数文字分の文字画像が一つ
の色で表されている場合には、第3の方法のように、一
文字毎に一つの色情報を記憶する必要はなく、第2の方
法を採用して複数文字毎に一つの色情報を記憶すれば足
りる。
【0007】以上のように、上記の公報記載の技術で
は、文字領域内に含まれる複数文字分の文字画像が一つ
の色で表されている場合であっても、一文字毎に色情報
を記憶するため、データ量が不必要に多くなってしまう
といった問題がある。すなわち、上記の公報記載の技術
によっては、文字画像の色再現性を保ちつつ、不必要な
データ量の増加を避けることが難しい。
【0008】さらに、上記の公報記載の技術では、たと
えばアルファベットの「S」の一文字が、赤と黒の二色
で表されている場合のように、一文字が複数の色で表さ
れている場合の処理が難しいといった問題がある。
【0009】
【発明が解決しようとする課題】本発明は上記従来技術
の有する問題点に鑑みなされたものであり、本発明の目
的は、カラー画像データを処理する場合に、文字画像の
色の再現性を保ちつつ、不必要なデータ量の増加を避け
ることができる画像処理装置、画像処理方法、および画
像処理プログラムを提供することである。特に、本発明
は、文字画像の色の再現性を保ちつつ、データ量の増加
を最大限に防止することができる画像処理技術を提供す
することを目的とする。
【0010】本発明の他の目的は、一文字が複数の色で
表されている場合に、一文字としての文字画像の特徴を
考慮して、適切に処理可能な画像処理装置、画像処理方
法、および画像処理プログラムを提供することである。
【0011】
【課題を解決するための手段】本発明の上記目的は、下
記の手段によって達成される。
【0012】(1)本発明の画像処理装置は、カラー画
像データに基づいて複数文字分の文字画像を含む領域を
抽出する領域抽出手段と、カラー画像データを二値化し
て二値化画像データを得る二値化手段と、抽出された領
域内に含まれる複数文字分の文字画像が一つの色で表さ
れているか複数の色で表されているかを判断する判断手
段と、抽出された領域内に含まれる複数文字分の文字画
像が一つの色で表されていると判断される場合、当該一
つの色に関する色情報を検出する検出手段と、抽出され
た領域内に含まれる複数文字分の文字画像が一つの色で
表されていると判断される場合、抽出された領域におけ
るカラー画像データを前記二値化手段によって二値化し
て得られる二値化画像データと前記領域において検出さ
れる前記色情報とを関連づけて記憶する記憶手段と、を
有することを特徴とする。
【0013】(2)上記の画像処理装置は、さらに、抽
出された領域内に含まれる複数文字分の文字画像が複数
の色で表されていると判断される場合、抽出された領域
を当該領域よりもサイズが小さい複数の分割領域に分割
する分割手段を有し、前記判断手段は、さらに、前記分
割手段によって得られた一の分割領域内に含まれる文字
画像が一つの色で表されているか複数の色で表されてい
るかを判断し、前記分割手段によって得られた一の分割
領域内に含まれる文字画像が一つの色で表されていると
判断される場合、前記検出手段は、さらに、当該一つの
色に関する色情報を検出するとともに、前記記憶手段
は、前記一の分割領域におけるカラー画像データを前記
二値化手段によって二値化して得られる二値化画像デー
タと前記一の分割領域において検出される前記色情報と
を関連づけて記憶する。
【0014】(3)上記の判断手段は、一の分割領域内
に含まれる文字画像が複数の色で表されていると判断し
た場合、前記分割手段は、さらに、前記一の分割領域を
当該分割領域よりもサイズが小さい新たな複数の分割領
域に分割する。
【0015】(4)上記の分割手段は、複数文字分の文
字画像を含む領域を一文字単位に分割するものであり、
前記判断手段が、一文字単位に領域を分割して得られた
一の分割領域内に含まれる一文字分の文字画像が複数の
色で表されていると判断する場合、前記記憶手段は、前
記二値化画像データと前記色情報とを関連づけて記憶す
る代わりに、前記一の分割領域におけるカラー画像デー
タを記憶する。
【0016】(5)上記の画像処理装置は、さらに、記
憶手段によって記憶された内容を含むデータファイルを
ネットワークを通じて他の機器へ出力するファイル出力
手段を有する。
【0017】(6)上記の画像処理装置は、さらに、原
稿を読み取って前記カラー画像データを得るための読取
手段を有する。
【0018】(7)本発明の画像処理方法は、カラー画
像データに基づいて複数文字分の文字画像を含む領域を
抽出するステップと、抽出された領域内に含まれる複数
文字分の文字画像が一つの色で表されているか複数の色
で表されているかを判断するステップと、抽出された領
域内に含まれる複数文字分の文字画像が一つの色で表さ
れていると判断される場合、当該一つの色に関する色情
報を検出するステップと、抽出された領域内に含まれる
複数文字分の文字画像が一つの色で表されていると判断
される場合、抽出された領域におけるカラー画像データ
を二値化して得られる二値化画像データと前記領域にお
いて検出される前記色情報とを関連づけて記憶するステ
ップと、を有することを特徴とする。
【0019】(8)本発明の画像処理プログラムは、カ
ラー画像データに基づいて複数文字分の文字画像を含む
領域を抽出する手順と、抽出された領域内に含まれる複
数文字分の文字画像が一つの色で表されているか複数の
色で表されているかを判断する手順と、抽出された領域
内に含まれる複数文字分の文字画像が一つの色で表され
ていると判断される場合、当該一つの色に関する色情報
を検出する手順と、抽出された領域内に含まれる複数文
字分の文字画像が一つの色で表されていると判断される
場合、抽出された領域におけるカラー画像データを二値
化して得られる二値化画像データと前記領域において検
出される前記色情報とを関連づけて記憶する手順と、を
コンピュータに実行させることを特徴とする。
【0020】(9)本発明のコンピュータ読み取り可能
な記録媒体は、上記(8)の画像処理プログラムを記録
したことを特徴とする。
【0021】
【発明の実施の形態】以下、本発明の実施の形態を、図
面を参照して詳細に説明する。
【0022】図1は、本発明の第1の実施形態にかかる
画像処理システムの全体構成を示すブロック図である。
画像処理システムは、デジタル複写機100、コンピュ
ータ200、およびプリンタ300を備える。デジタル
複写機100は、ネットワーク400を介してコンピュ
ータ200およびプリンタ300と通信可能に接続され
ている。
【0023】デジタル複写機100は、カラー画像デー
タを処理可能なデジタル複写機100である。デジタル
複写機100は、カラー原稿を読み取って得られたカラ
ー画像データに基づいて文字領域、写真領域、および図
形領域を抽出し、各領域の種類毎に異なる画像処理を行
う。この結果、デジタル複写機100は、所定の形式の
データファイルを作成する。作成されたファイルは、コ
ンピュータ200へ出力される。このように、デジタル
複写機100は、原稿を読み取って得られた画像データ
に基づいてファイルを作成し、作成したファイルをサー
バ(たとえば、コンピュータ200)に出力する機能
(スキャンtoサーバ機能)を有する。
【0024】また、デジタル複写機100は、原稿を読
み取って得られた画像データに基づいてプリントジョブ
をプリンタ300に送信する機能(スキャンtoプリン
ト機能)を有する。デジタル複写機100は、もちろ
ん、カラー原稿を読み取って得られた画像データに基づ
いて、自ら用紙上に印刷する複写機能を有する。さら
に、図示していないが、デジタル複写機100は、原稿
を読み取って得られた画像データに基づいて電子メール
を作成し、作成した電子メールを送信する機能(スキャ
ンtoEメール機能)を有していてもよい。
【0025】以上のように、本実施の形態のデジタル複
写機100は、複数の機能を持った複合機、すなわち、
多機能周辺機器(MFP)として機能するものである。
【0026】コンピュータ200は、デジタル複写機1
00から画像データのファイルを受信する。受信したフ
ァイル内の各領域別の画像データを用いて、さらに文字
認識などの種々の画像処理を実行する。プリンタ300
は、デジタル複写機200からプリントジョブを受信
し、または、コンピュータ200からプリントジョブを
受信することによって、用紙上にプリントアウトする。
【0027】つぎに、上記各機器の構成について説明す
るが、各機器で同様の機能を有する部分については、説
明の重複を避けるため初回のみその説明を行い、2回目
以降はその説明を省略する。
【0028】図2は、本実施形態にかかるデジタル複写
機100の構成を示すブロック図である。デジタル複写
機100は、CPU101、ROM102、RAM10
3、記憶部104、操作部105、ディスプレイ10
6、原稿読取部107、画像処理部108、印刷部10
9、およびインタフェース110を備えている。
【0029】CPU101は、プログラムにしたがって
上記各部の制御や各種の演算処理を行う。したがって、
CPU101は、各部を制御するための制御部として機
能する。しかしながら、本実施の形態と異なり、各部を
制御するための制御用の論理ICからなる制御部をCP
U101の他に設けてもよい。
【0030】ROM102は、制御プログラムを記憶す
る。RAM103は、作業領域として後述するヒストグ
ラムなどのデータを一時的に記憶する。記憶部104
は、各種プログラムおよびパラメータを記憶する。さら
に、記憶部104は、画像処理により得られた画像デー
タおよび情報を記憶するためにも使用される。
【0031】操作部105は、メカニカルキーおよびキ
ーボードであり、デジタル複写機100において作成さ
れたファイルの出力先、ファイルの形式、およびプリン
ト条件、動作の開始および終了を指示するために用いら
れる。ディスプレイ106は、たとえば、液晶ディスプ
レイであり、プリント条件の設定内容などの各種の情報
を表示する。
【0032】原稿読取部107は、所定の読み取り位置
にセットされた原稿に蛍光ランプ等の光源を用いて光を
照射し、その反射光をCCDやCIS等の受光素子で光
電変換して、その電気信号から画像データを生成する。
本発明では、カラー画像データとしてRGB(赤緑青)
で表現されたカラービットマップデータが得られる。原
稿読取部107は、自動原稿搬送装置(ADF)を備え
ていてもよい。自動原稿搬送装置は、複数枚の原稿を一
枚ずつ所定の読み取り位置まで搬送する。この結果、原
稿が順次読み取られる。
【0033】画像処理部108は、画像処理を実行する
ためのプロセッサであり、たとえば、画像処理用のDS
P(デジタルシグナルプロセッサ)である。画像処理部
108は、CPU101の制御を受けて、原稿を読み取
って得られたカラー画像データに基づいて文字領域を抽
出する領域抽出処理、カラー画像データを二値化して二
値化画像データを取得する二値化処理、ヒストグラムを
求める処理、および、色情報の検出処理など種々の画像
処理を実行する。画像処理の内容については、後述す
る。
【0034】印刷部109は、プリンタエンジンであ
り、画像処理後の画像データに基づいて、用紙上に印刷
する。インタフェース110は、ネットワーク400に
接続しネットワーク400上の他の機器と通信するため
のインタフェースである。
【0035】図3は、本実施形態にかかるコンピュータ
の構成の一例を示すブロック図である。図3において、
コンピュータ200は、CPU201、ROM202、
RAM203、記憶部204、操作部205、ディスプ
レイ206、およびインタフェース207を備える。
【0036】CPU201は、制御と演算の各種処理を
行う。ROM202は各種プログラムを記憶する。RA
M203は作業領域として一時的にデータを記憶する。
記憶部204は、ハードディスクなどの記録メディアで
あり、各種プログラムやデータを記憶する。操作部20
5は、キーボードやマウスなどのポインティングデバイ
スであり、各種の入力を行うために使用される。ディス
プレイ206は、各種の表示を行う。インタフェース2
07は、ネットワーク400に接続しネットワーク40
0上の他の機器と通信するためのインタフェースであ
る。
【0037】コンピュータ200は、インタフェース2
07を介してデジタル複写機100からファイルを読み
込む。そして、読み込んだファイルに含まれる文字画像
データ、図形画像データ、写真画像データを夫々処理す
る。なお、具体的には、コンピュータ200は、文字領
域に対応する文字画像データに対して文字認識処理を施
する。その結果、コンピュータ200は、ビットマップ
データで示された文字画像データを、たとえばASCI
Iコードなどの文字コードデータに変換する。同様に、
ビットマップデータとして示された図形画像データをベ
クタデータに変換する。したがって、ビットマップデー
タとして示された文字画像データに基づいて文字認識処
理するための文字認識用ソフトウエア、およびビットマ
ップデータとして示された図形画像データをベクタデー
タへ変換するためのラスタ−ベクタ変換用ソフトウエア
が記憶部204にインストールされている。
【0038】プリンタ300は、プリントジョブが制御
言語を含む場合はこれを解釈してラスタライズを行い、
用紙上にプリントアウトする。プリンタ300の構成
は、従来のプリンタと同様であるので、詳しい説明を省
略する。
【0039】つぎに、本実施形態における画像処理シス
テムの動作の概要を説明する。
【0040】図4は、図2に示されるデジタル複写機1
00の処理手順を示すフローチャートである。図4のフ
ローチャートに示されるアルゴリズムは、画像処理プロ
グラムとして、ROM102または記憶部104に記憶
されており、CPU101および画像処理部108によ
って実行される。
【0041】ステップS100では、RGB→YCbC
r変換を実行する。RGB→YCbCr変換は、RGB
(赤緑青)で表現されたカラー画像データから、明度Y
と二つの色差Cr、Cbとで表現されたカラー画像デー
タへの線形変換をいう。RGB→YCbCr変換の内容
は、従来の処理と同様であるので、詳しい説明を省略す
る。
【0042】ステップS101では、カラー画像データ
に基づいて文字領域を抽出する。そして、文字領域内に
含まれる複数文字分の文字画像に対して、所定の処理を
施す。このステップS101における一連の処理が、本
発明の特徴的な処理である。ステップS101の処理の
結果、文字画像データが作成される。文字画像データに
は、文字領域内に含まれる複数文字分の文字画像の色情
報を含めることが可能となる。ここで、「文字画像」と
は、文字を構成する画像を意味する。ステップS101
の処理内容の詳細は、後述する。
【0043】ステップS102では、カラー画像データ
から文字画像を除去する。この結果、除去した文字画像
が存在していた部分は、背景の色で補完される。
【0044】ステップS103では、写真領域と図形領
域とが抽出される。なお、「写真領域」とは、写真画像
を含む画像領域をいい、中間調濃度で比較的滑らかに表
現された画像領域である。「図形領域」とは、線画図形
などの図形画像を含む画像領域をいい、たとえば、コン
ピュータで作成された図である。
【0045】写真領域と図形領域は、既存の方法を用い
て分離することができる。たとえば、明度が連続的に変
化している領域を写真領域とし、明度が離散的に変化し
ている領域を図形領域とする。具体的には、輪郭線抽出
などによってエッジ(輪郭線部分)を検出し、一定の方
向に沿って、エッジ間における明度値とその出現度数と
を示すヒストグラムが作成される。このヒストグラムの
形状から、出現した明度値の連続性を示す特徴量が検出
される。この検出された特徴量に基づいて、出現した明
度値が連続的である場合には、このエッジに囲まれた領
域は、写真領域として抽出される。一方、出現した明度
値が連続的でない場合には、このエッジに囲まれた領域
は、図形領域として抽出される。
【0046】以上のように、ステップS101において
文字領域が抽出され、ステップS103において写真領
域と図形領域とが夫々抽出されることによって、領域分
離が完了する。なお、写真領域と図形領域とは重ならな
い。一方、文字領域は、他の種類の領域と重なる場合が
ある。
【0047】ステップS104、ステップS105、お
よびステップS106では、文字領域における文字画像
データ、写真領域における写真画像データ、および図形
領域における図形画像データに対して、領域種類に応じ
て、各領域種類に適した画像圧縮および付随する画像処
理が実行される。
【0048】具体的には、ステップS104では、ステ
ップS101の処理によって得られた文字領域における
文字画像データに対して、たとえば、MMR(Modified
Modified Read)またはJBIC(Joint Bi-level Exp
erts Group)として規定された圧縮処理が実行される。
【0049】ステップS105では、写真領域における
写真画像データを、解像度変換により元の状態よりも低
い解像度に変換する。なお、解像度変換に代えて、スム
ージングフィルタ処理(円滑化処理)を実行してもよ
い。この結果、原稿の網点によるモアレの影響を除去で
きる。そして、解像度変換またはスムージング処理がさ
れた写真画像データに対して、JPEG(Joint Photog
raphic Experts Group)として規定された圧縮処理が実
行される。
【0050】ステップS106では、図形領域における
図形画像データに対して、減色処理を実行する。減色処
理によって、データ量を削減するとともに、階調変化の
ない均一色で表されていた部分の再現性を向上すること
ができる。本来的には均一色で表されていた部分におい
て、画像読み取り段階や原稿の網点の影響により、色む
らが発生する場合がある。本ステップの減色処理によっ
て、本来的には均一色で表されていた部分の色むらが除
去され、均一色に戻る。そして、減色処理された図形画
像データに対して、たとえば、Flateアルゴリズム
を用いて圧縮処理が実行される。Flateアルゴリズ
ムとは、gzipおよびzipなどのファイル形式で採
用されている圧縮用のアルゴリズムである。
【0051】ステップS107では、YCbCr→RG
B変換を実行し、各領域の画像データをRGBで表現さ
れた画像データに戻す。
【0052】ステップS108では、ステップS104
〜ステップS106において圧縮された文字画像デー
タ、写真画像データ、および図形画像データを合成し
て、1つのファイルを作成する。本実施の形態では、合
成して得られるファイルの形式として、PDF(Portab
le Document Format)を採用する。しかしながら、本実
施の形態と異なり、合成して得られるファイルの形式と
して、PDF以外のファイル形式を採用することができ
る。また、ユーザが複数のファイル形式のうちから希望
するファイル形式を指定することができるように構成す
ることもできる。
【0053】ステップS109では、ステップS108
で得られたファイルを出力先であるコンピュータ200
へ出力する。
【0054】次に、コンピュータ200の処理手順を説
明する。図5は、図3に示されるコンピュータ200の
処理手順を示すフローチャートである。図5のフローチ
ャートに示されるアルゴリズムは、画像処理プログラム
として、ROM202または記憶部204に記憶されて
おり、CPU201によって実行される。
【0055】ステップS200では、デジタル複写機2
00から出力されたファイルを受信する。ファイルは、
インタフェース207を介して記憶部204内に読み込
まれる。受信したファイルには、文字画像データ、写真
画像データ、および図形画像データが別々に記憶されて
いる。なお、各データは、基本的には、ビットマップデ
ータである。
【0056】ステップS201およびステップS202
では、圧縮して記憶されている文字画像データおよび図
形画像データを伸張する。
【0057】ステップS203では、文字画像データに
基づいて、文字認識処理を実行する。文字認識処理に
は、通常のOCRソフトウエアで用いられている処理と
同様の処理を適用することができるので、詳しい処理内
容の説明は省略する。この結果、ビットマップデータ形
式の文字画像データは、ASCIIコードなどの文字コ
ードに変換される。なお、この場合であっても、上述し
た文字画像データに含まれる色情報は保持される。した
がって、最終的には、文字コードと色情報とからなる文
字画像データが作成される。
【0058】ステップS204では、ラスタ−ベクタデ
ータが実行され、ベクタデータ形式の図形画像データが
作成される。
【0059】ステップS205では、文字領域における
文字コードおよび色情報とからなる文字画像データと、
写真領域におけるビットマップデータ形式の写真画像デ
ータと、図形領域におけるベクタデータ形式の図形画像
データと、が合成される。こ結果、最終的な合成データ
ファイルが作成され、記憶部204内に記憶される。
【0060】図6、図7、および図8は、本実施の形態
におけるデータの出力例を示す。図6は、文字画像デー
タの出力例を示し、図7は、図形画像データの出力例を
示し、図8は、写真画像データの出力例を示す。
【0061】コンピュータ200が文書閲覧用のサーバ
であれば、各ユーザは、作成された合成データファイル
にアクセス可能となり、各ユーザの間でデータの共有化
を推進することができる。
【0062】以上のように、本実施の形態における画像
処理システムの動作の概要を説明したが、本発明の特徴
的な点は、図4のステップS101に示されるデジタル
複写機の処理にある。以下、この図4のステップS10
1の処理を詳細に説明する。
【0063】図9および図10は、図4のステップS1
01のサブルーチンを示すフローチャートである。
【0064】ステップS300では、原稿を読み取って
得られたカラー画像データに基づいて複数文字分の文字
画像を含む文字領域を抽出する。本実施の形態では、画
像データを微小領域に分けて、微小領域毎に画像データ
を周波数成分に分解する。各微小領域において、文字画
像に特有な周波数を検出することによって、この微小領
域が文字画像を含むものか否かを判別する。文字画像を
含むと判別された複数の微小領域が所定の距離内に隣接
して存在する場合には、隣接する複数の微小領域を連結
する連結処理を実行する。ここで、所定の距離は、上述
した微小領域の連結処理を実行する範囲を定める。な
お、周波数成分への分解は、通常の離散コサイン変換
(DCT)で用いられている処理と同様であるので、詳
しい説明は省略する。
【0065】図11は、カラー画像データに基づいて抽
出された複数文字分の文字領域の一例を示す。一つの矩
形が一つの文字領域に対応する。図11に示されるよう
に、1ページ分のカラー画像データに基づいて、複数の
文字領域を抽出することができる。図11に示される場
合では、抽出される一つの文字領域のサイズは、単語単
位程度に設定されている。しかしながら、本発明は、こ
の場合に限られず、単語単位よりも広い範囲(たとえば
行単位またはページ単位程度)を一つの文字領域として
抽出することもできる。換言すれば、上述した微小領域
の連結処理を実行する範囲、すなわち上記した所定の距
離を適宜変更することによって、抽出される文字領域の
サイズを変更することができる。具体的には、上記の所
定距離を長くすることによって、抽出される文字領域の
一つあたりのサイズは、拡大する。
【0066】図9のステップS301では、複数の文字
領域のうちから一つの領域を選択する。つぎに、ステッ
プS302では、文字領域におけるカラー画像データを
二値化して二値化画像データを得る。ここで、「文字領
域におけるカラー画像データ」とは、入力されたカラー
画像データのうち、この文字領域に対応する部分につい
てのみ抜き出したデータである。なお、この二値化処理
の過程で、文字領域内に含まれる文字画像と背景とが分
離される。すなわち、文字画像データを作成する上で背
景が不要であるので、背景が除去される。背景を除去す
るためには、たとえば、文字画像と背景との明度の差が
用いられる。
【0067】まず、文字領域ごとに、出現する明度値と
その出現度数とが検出される。具体的には、各明度値と
その出現度数との関係を示すヒストグラムが作成され
る。この結果、ヒストグラムには、文字画像に対応する
出現度数のピークと背景に対応する出現度数のピークと
が現れる。背景が占める面積は文字画像が占める面積に
比べて大きいため、より大きい出現度数のピークが背景
に対応する。この結果、より大きい出現度数のピークを
示す明度値を背景の明度値Ybgとし、小さい出現度数
のピークを示す明度値を文字画像の明度値Ychとす
る。
【0068】背景の明度値Ybgが文字画像の明度値Y
chよりも高い場合には、背景の明度値Ybgから所定
値k(kは正数)を引いた値(Ybg−k)を閾値とす
る。この閾値(Ybg−k)よりも高い明度値を示す画
素については、背景を構成する画素であるとして、値を
0とし、この閾値(Ybg−k)以下の明度値を示す画
素については、文字画像を構成する画素(「文字画素」
という)であるとして、値を1とする。
【0069】一方、背景の明度値Ybgが文字画像の明
度値Ychよりも低い場合には、背景の明度値Ybgに
所定値k(kは正数)を加えた値(Ybg+k)を閾値
とする。この閾値(Ybg+k)よりも低い明度値を示
す画素については、背景を構成する画素であるとして、
値を0とし、この閾値(Ybg+k)以上の明度値を示
す画素については、文字画素であるとして、値を1とす
る。以上の処理の結果、文字領域においてカラー画像デ
ータが二値化されて、二値化画像データが得られる。
【0070】二値化処理によって得られる二値化画像デ
ータは、それぞれの画素が文字画素を構成する画素であ
るか否かを一画素あたり1ビットの情報(1または0)
で示した画像データであり、一般には、1ビット画像デ
ータまたは1ビットBMP(1ビットビットマップデー
タ)と呼ばれる。
【0071】この二値化画像データは、マスクとして用
いることができる。具体的には、カラー画像データの全
体から、文字画像部分のカラー画像データを取り出すた
めのマスクとして使用することができる。すなわち、カ
ラー画像データのうちで、文字画素におけるデータのみ
を有効とすることによって、文字画像部分のカラー画像
データを取り出すことができる。
【0072】ステップS303では、上述のように、二
値化画像データをマスクとして用いることによって取り
出された文字画像部分のカラー画像データについて、減
色処理を実行する。本実施の形態では、Y,Cr,Cb
の各8ビットのカラー画像データを夫々5ビットのデー
タに変換する。この結果、文字画像のエッジ部分の色の
ばらつきや、網点による影響を防止することができる。
なお、減色処理を実行する場合であっても、Cr,Cb
の各8ビットのカラー画像データは、後続する処理のた
めに必要であるので、RAM103または記憶部104
に格納したまま維持される。
【0073】ステップS304では、明度Y、色差C
r、および色差Cbのヒストグラムを作成する。明度Y
を例にとって説明すると、一つの文字領域毎に明度値Y
(0〜31の32段階で示される)とその出現度数Hi
st[Y]とを検出する。ステップS304の処理にお
いて、上述のように、背景部分が除去された文字画像部
分のカラー画像データに基づいて、ヒストグラムが作成
されるため、背景の色は、ヒストグラムに影響を与えな
い。
【0074】図12は、文字領域とこの文字領域におけ
る明度Yのヒストグラムの一例を示す。図12(A)に
示される文字領域内には、「total」という複数文
字分の文字画像が含まれており、この文字画像は、黒一
色で表されている。
【0075】図12(B)は、図12(A)に示される
文字画像部分のカラー画像データに基づいて作成され
た、各明度値とその出現度数との関係を示すヒストグラ
ムである。
【0076】同様に、図13および図14は、他の文字
領域とこの他の文字領域における明度Yのヒストグラム
についての一例を示す。
【0077】図13(A)に示される文字領域内には、
「red」という複数文字分の文字画像が含まれてお
り、この文字画像は、赤一色で表されている。図13
(B)は、図13(A)に示される文字画像部分のカラ
ー画像データに基づいて作成された、各明度値とその出
現度数との関係を示すヒストグラムである。
【0078】図14(A)に示される文字領域内には、
「stage2」という複数文字分の文字画像が含まれ
ており、この文字画像は、黒と赤という複数の色で表さ
れている。具体的には、「stage」とうい部分は黒
色で表されており、「2」という部分は赤色で表されて
いる。図14(B)は、図14(A)に示される文字画
像部分のカラー画像データに基づいて作成された、各明
度値とその出現度数との関係を示すヒストグラムであ
る。なお、色差CrおよびCbについてのヒストグラム
の同様に作成される。
【0079】ステップS305では、ヒストグラムを用
いて、色分布幅を算出する。本実施の形態では、「色分
布幅」は、所定の閾値(第1閾値)以上の出現度数を示
す明度値(一般的には、明度値のみならず、色差Cr,
Cbも含むので、画素値)の分布範囲を意味する。好ま
しくは、「色分布幅」は、所定の閾値以上の出現度数を
示す明度値のうちで最も高い明度値と最も低い明度値と
の差として定義される。図12に示される場合であれ
ば、第1閾値以上の出現度数を示す明度値は、4、5、
6、および7であるから、色分布幅は、3(=7−4)
である。同様に、図13および図14に示される場合、
色分布幅は、それぞれ2(=17−15)、12(=1
6−4)である。なお、色差CrおよびCbについての
色分布幅も同様に算出される。
【0080】ステップS306では、ヒストグラムに現
れているピークの数を検出する。本実施の形態では、簡
便な方法として、明度(一般には画素値)に対する出現
度数の変化量(傾き)が所定値以上であるか否かによっ
てピークを検出する。すなわち、ヒストグラムにおける
出現度数Nの変化量を計算して、各明度値とその出現度
数の変化量との関係を示す第2のヒストグラムを作成す
る。具体的には、Hist2[i]=Hist[i]−
(Hist[i−2]+Hist[i+2])/2とい
う計算式をもちいて、各明度値とその出現度数の変化量
を計算する。ここで、iは、明度値(一般には、画素
値)を示す。Hist2[i]は、明度値iにおける出
現度数の変化量を示す。なお、本実施の形態では、明度
値iが、0、1、30、31の場合、i−2またはi+
2の値が存在しないため、出現度数の変化量の計算を実
行しない。また、出現度数の変化量Hist2[i]が
負の値となる場合には、すべて0としている。
【0081】図15は、図14(A)に示される文字画
像部分のカラー画像データに基づいて作成された、明度
値とその出現度数の変化量の関係を示す第2のヒストグ
ラムである。横軸は、各明度値を示し、縦軸は、出現度
数の変化量を示す。
【0082】所定値(第2閾値)以上の出現度数の変化
量を示す明度の群(グループ)の数を検出する。この明
度の群の数をピークの数とすることができる。図15に
示される例の場合、第2閾値以上の出現度数変化量を示
す明度の群が2つ存在するので、ピークの数は、2であ
る。なお、色差CrおよびCbのヒストグラムに現れる
ピークの数についても同様に検出することができる。
【0083】なお、他の方法を用いて、ピークの数を検
出することもできる。また、ステップS305とステッ
プS306の処理順序は、適宜変更することができる。
【0084】ステップS307およびステップS308
では、文字領域に含まれる複数文字分の文字画像が一つ
の色で表されているか複数の色で表されているかを判断
する。本実施の形態では、ステップS305で算出され
た色分布幅およびステップS306で検出されたピーク
の数に基づいて、文字領域に含まれる複数文字分の文字
画像が一つの色で表されているか複数の色で表されてい
るかを判断する。
【0085】ステップS307では、ステップS305
で算出された色分布幅、すなわち明度Y、色差Cr、お
よびCbのそれぞれの色分布幅が、所定の閾値(第3閾
値)未満であるか否かが判断される。色分布幅が、第3
閾値未満である場合には(ステップS307:YE
S)、さらに、ステップS308の処理が実行される。
【0086】ステップS308では、明度Y、色差C
r、および色差Cbの各ヒストグラムに現れるピークの
数がそれぞれ一つであるか否かが判断される。
【0087】ステップS307およびステップS308
における処理の結果、明度Y、色差Cr、色差Cbにつ
いての色分布幅が第3閾値未満であり、かつ、検出され
たピークの数が1である場合には(ステップS307:
YES、かつ、ステップS308:YES)、文字領域
内に含まれる複数文字分の文字画像が一つの色で表され
ていると判断される。この結果、ステップS309およ
びステップS310の処理が実行される。
【0088】一方、色分布幅が第3閾値以上であるか
(ステップS307:NO)、または検出されたピーク
の数が複数である場合には(ステップS308:N
O)、文字領域内に含まれる複数文字分の文字画像が複
数の色で表されていると判断される。この結果、ステッ
プS311の処理が実行される。
【0089】なお、ステップS307とステップS30
8の処理の順序は、適宜変更することができる。
【0090】(文字画像が一つの色で表されていると判
断される場合)文字領域内に含まれる複数文字分の文字
画像が一つの色で表されていると判断される場合、ま
ず、ステップS309において、この一つの色に関する
色情報を検出する。文字画像部分のカラー画像データに
基づいて作成されたヒストグラムにおいて、もっとも出
現度数の高い画素値(すなわち明度Y,および色差C
b,Cr)を求め、これを色情報とすることができる。
明度Y,および色差Cb,Crで表現された色情報を、
さらに、YCbCr→RGB変換にすることによって、
RGBで表現された色情報を求めることもできる。ま
た、減色処理していない各8ビットのカラー画像データ
に基づいて、色情報を検出することもできる。この場合
には、合計24ビットの色情報が検出される。本実施の
形態と異なり、出現度数の高い画素値に代えて、画素値
の最小値または平均値を色情報として検出することもで
きる。
【0091】ステップS310では、文字領域において
カラー画像データを二値化して得られた二値化画像デー
タ(1ビット画像データ)と上記の色情報を関連づけて
記憶する。換言すれば、二値化画像データと色情報とが
関連づけられたデータを、この文字領域における文字画
像データとして記憶する。
【0092】(文字画像が複数の色で表されていると判
断される場合)一方、文字領域内に含まれる複数文字分
の文字画像が複数の色で表されていると判断される場
合、ステップS311の処理が実行される。
【0093】ステップS311では、一文字単位に文字
領域を分割ずみか否かが判断される。一文字単位に文字
領域を分割していない状態では(ステップS311:N
O)、ステップS312の処理が実行される。
【0094】ステップS312では、文字領域の分割処
理が実行される(ステップS312)。ここで、文字領
域の分割処理とは、一つの文字領域を、この文字領域よ
りもサイズが小さい複数の分割領域に分割する処理であ
る。本実施の形態では、抽出された単語単位程度の文字
領域を一文字単位の分割領域に分割する。
【0095】図16は、図14(A)に示される文字領
域を分割した例を示す。図16に示される例では、「s
tage2」という複数文字分の文字画像を含む文字領
域が、「S」、「t」、「a」、「g」、「e」、およ
び「2」という一文字単位の6つの分割領域に分割され
る。複数の分割領域への分割処理は、種々の方法を用い
て実現することができる。
【0096】簡便な方法としては、文字列に垂直方向の
線分(たとえば、図16における線分aや線分b)に沿
って、画素値のヒストグラムを求める。この結果、文字
画像と重なっていない線分bが検出される。この線分b
を用いて、文字領域を分割することができる。なお、文
字列に垂直な方向とは、英文のように横書きの文字列の
場合には縦方向であり、縦書きの文字列の場合には、横
方向である。
【0097】また、他の方法としては、図9のステップ
S300で説明した連結処理と同様の手法によって分割
領域を抽出することもできる。より具体的には、一文字
程度の距離内に隣接して存在する複数の微小領域を連結
し、連結して得られた連結部分毎に、ラベリングするこ
とによって、一文字単位に分割された分割領域を求める
ことができる。
【0098】ステップS313では、分割により得られ
た各分割領域を選択して、夫々の領域毎に、先に説明し
たステップS304〜ステップS308と同様の処理が
実行される。具体的には、分割処理によって得られた一
の分割領域内に含まれる文字画像が一つの色で表されて
いるか複数の色で表されているかを判断する。
【0099】分割処理によって得られた一の分割領域内
に含まれる文字画像が一の色で表されていると判断され
る場合(ステップS307:YES,かつステップS3
08:YES)、ステップS309において、この一の
色に関する色情報を検出する(ステップS309)。そ
して、この分割領域におけるカラー画像データを二値化
して得られる二値化画像データ(1ビット画像データ)
と色情報とを関連づけて記憶する。
【0100】一方、分割処理によって得られた一の分割
領域内に含まれる文字画像が複数の色で表されていると
判断される場合(ステップS307:NO,またはステ
ップS308:NO)、ステップS311の処理が実行
される。
【0101】すでに、一文字単位に文字領域を分割ずみ
の場合(ステップS311:YES)、ステップS31
4の処理が実行される。
【0102】ステップS314では、一文字単位に分割
して得られた分割領域内に含まれる一文字分の文字画像
が複数の色で表されていると判断される場合の処理とし
て、二値化画像データと色情報とを関連づけて記憶する
代わりに、この分割領域における二値化されていないカ
ラー画像データ(たとえば、24ビットのビットマップ
データ)をこの分割領域における文字画像データとして
記憶する。このように、一文字単位に分割して得られた
分割領域内に含まれる一文字分の文字領域が複数の色で
表されていると判断される場合には、さらに、領域を分
割することなく、カラー画像データをそのまま記憶す
る。
【0103】図17は、一文字分の文字画像「S」が、
赤色(斜線部)と黒色という複数の色で表されている場
合の例を示す。たとえば、飾り文字の場合には、一文字
分の文字画像が複数の色で表される場合がある。この場
合は、一文字毎に一つの色情報を検出したのでは、色の
再現性に問題が生じる一方、文字コードに変換する際の
最小単位であるため、領域を分割するのも問題であるた
め、カラー画像データをそのまま記憶する。
【0104】ステップS315では、すべての文字領域
について処理が完了したか否かを判断し、すべての文字
領域について処理が完了していない場合には(ステップ
S315:NO)、図9のステップS301に戻り、別
の文字領域を選択し、同様の処理を繰り返す。すべての
文字領域について処理が完了した場合には(ステップS
315:YES)、図9および図10に示した一連の処
理が完了した場合として、リターンする。
【0105】このように、本実施の形態によれば、文字
領域内に含まれる複数文字分の文字画像が一つの色で表
されているか否かを判断し、文字画像が一つの色で表さ
れていると判断される場合、この一つの色に関する色情
報を検出し、文字画像を二値化して得られた二値化画像
データと色情報とを関連づけた文字画像データとして記
憶する。一方、文字画像が複数の色で表されていると判
断される場合、文字領域をさらにサイズが小さい複数の
分割領域に分割し、同様の処理を繰り返し実行する。な
お、記憶された文字画像データを内容に含む合成データ
ファイルが作成され、作成された合成データファイル
は、コンピュータ200へ出力される。
【0106】したがって、本実施の形態によれば、記憶
された文字画象データに基づいて文字画象を再現する場
合における文字画像の色の再現性を保ちつつ、データ量
が不必要に増加してしまうことを防止することができ
る。
【0107】以上のように、本発明の好適な実施の形態
について説明したが、本発明は、この実施の形態に限ら
れず、発明の思想の範囲内で、種々の変形、省略、およ
び追加をすることができる。
【0108】たとえば、上記の説明では、YCrCbで
表現されたカラー画像データに対して処理を実行してい
るが、本発明は、この場合に限られない。たとえば、R
GBまたはLabなどの形式で表現されたカラー画像デ
ータに対して、処理を実行することもできる。
【0109】また、上記の説明では、単語単位程度の文
字領域を抽出し、必要に応じて、この文字領域を一文字
単位の分割領域に分割しているが、抽出する文字領域の
サイズ、および分割領域のサイズは、この場合に限られ
ない。
【0110】また、抽出された文字領域を、一段階の分
割処理によって一文字単位の分割領域に分割するのでは
なく、複数段階の分割領域を経て、最終的に一文字単位
の分割領域に分割することもできる。すなわち、文字領
域を分割して得られた一の分割領域内に含まれる複数文
字分の文字画像が複数の色で表されていると判断される
場合には、さらに、この分割領域をサイズの小さい新た
な複数の分割領域に分割することも可能である。
【0111】たとえば、一ページ程度のサイズの文字領
域を抽出し、この文字領域内に存在する文字画像が一つ
の色で表されていないと判断される場合、一行程度のサ
イズの分割領域に分割し、さらに、必要に応じて、単語
程度のサイズの分割領域や一文字単位の分割領域に分割
することもできる。このように、複数文字分の文字画像
を含む領域を段階的に分割する処理は、図9のステップ
S300で説明したように、文字画像を含む微小領域の
連結処理を実行する範囲、具体的には上記の所定の距離
を変更することによって、実現できる。すなわち、所定
の距離を段階的に短くすることによって、連結の範囲が
狭くなり、一つの分割領域の範囲が、ページ単位、一行
単位、単語単位、文字単位というように、適宜変更され
る。この結果を利用して、一の文字領域を段階的に分割
することが可能となる。
【0112】また、データ量の削減の見地からは、上述
したように、一の文字領域内に含まれる複数文字分の文
字画像が複数の色で表されていると判断される場合、こ
の文字領域を複数の分割領域に分割することが望まし
い。しかしながら、本発明は、この場合に限られず、一
の文字領域内に含まれる複数文字分の文字画像が複数の
色で表されていると判断される場合、その文字領域にお
けるカラー画像データを文字画像データとして記憶する
処理を採用することができる。この場合であっても、一
の文字領域内に含まれる複数文字分の文字画像が複数の
色で表されているか否かを判断するステップを実行する
ため、データ量の削減に寄与することができる。
【0113】また、以上の説明では、複数の文字領域に
おける色情報が互いに同じ場合であっても、文字領域毎
に色情報を記憶するが、本発明は、この場合に限られな
い。たとえば、同じ色情報を持つ複数の文字領域を最終
的に統合することができる。
【0114】以上の説明では、文字認識(ステップS2
03)、ラスタベクタ変換(ステップS204)、およ
び最終的な合成データファイルの作成(ステップS20
5)について、コンピュータ200が実行する場合を説
明したが、文字認識機能やラスタベクタ変換機能をデジ
タル複写機100が備えている場合には、かかる処理に
ついても、デジタル複写機100で実行することができ
る。
【0115】さらに、以上の説明では、本発明の画像処
理装置をデジタル複写機に適用した場合を説明したが、
本発明は、この場合に限られない。抽出した文字領域内
に含まれる文字画像が一つの色で表されているか複数の
色で表されているかを判断し、一つの色で表されている
と判断される場合に、この文字領域におけるカラー画像
データを二値化して得られる二値化画像と一つの色に関
する色情報とを関連づけて記憶する機能を有する機器で
あれば、スキャナ、プリンタ、およびコンピュータなど
のいかなる機器に対して、本発明を適用することができ
る。
【0116】本発明による画像処理装置および画像処理
方法は、上記図9および図10に示される各手順を実行
するための専用のハードウエア回路によっても、また、
上記各手順を記述した所定のプログラムをCPUが実行
することによっても実現することができる。後者により
本発明を実現する場合、画像処理装置を動作させる上記
所定のプログラムは、フレキシブルディスクやCD−R
OM等のコンピュータ読取可能な記録媒体によって提供
されてもよいし、インターネット等のネットワークを介
してオンラインで提供されてもよい。この場合、コンピ
ュータ読取可能な記録媒体に記録されたプログラムは、
通常、ROMやハードディスク等に転送され記憶され
る。また、このプログラムは、たとえば、単独のアプリ
ケーションソフトとして提供されてもよいし、画像処理
装置の一機能としてその装置のソフトウエアに組み込ん
でもよい。としてその装置のソフトウエアに組み込んで
もよい。
【0117】
【発明の効果】上述したように、本発明によれば、文字
領域内に含まれる複数文字分の文字画像が一つの色で表
されていると判断される場合、文字領域におけるカラー
画像データを二値化して得られた二値化画像と一つの色
に関する色情報とを関連づけて記憶する。したがって、
本発明によれば、カラー画像データを処理する場合に、
文字画像の色の再現性を保ちつつ、不必要なデータ量の
増加を避けることができる新規の画像処理技術を提供す
ることができる。
【0118】また、本発明によれば、抽出された文字領
域内に含まれる複数文字分の文字画像が複数の色で表さ
れていると判断される場合、文字領域をサイズが小さい
複数の分割領域に分割し、さらに、分割領域内に含まれ
る文字画像が一つの色で表されているか否かを判断する
ので、文字画像の色の再現性を保ちつつ、データ量の増
加を最大限に防止することができる。
【0119】さらに、本発明によれば、一文字分の文字
画像が複数の色で表されていると判断される場合には、
一文字分の画像の結合性を考慮して、分割処理を行うこ
となく、二値化していないカラー画像データを記憶する
ように処理する。したがって、一文字分の画像について
適切な処理を実行することができる。
【図面の簡単な説明】
【図1】 本発明の実施形態にかかる画像処理システム
の全体構成を示すブロック図である。
【図2】 図1におけるデジタル複写機の構成を示すブ
ロック図である。
【図3】 図1におけるコンピュータの構成を示すブロ
ック図である。
【図4】 図2に示されるデジタル複写機の処理手順を
示すフローチャートである。
【図5】 図3に示されるコンピュータの処理手順を示
すフローチャートである。
【図6】 本実施の形態における文字画像データの出力
例を示すフローチャートである。
【図7】 本実施の形態における図形画像データの出力
例を示すフローチャートである。
【図8】 本実施の形態における写真画像データの出力
例を示すフローチャートである。
【図9】 図4のステップS101のサブルーチンを示
すフローチャートである。
【図10】 図9に後続するフローチャートである。
【図11】 抽出された複数文字分の文字領域の一例を
示す図である。
【図12】 黒色一色で表された文字画像を含む文字領
域と、この文字領領域における明度のヒストグラムを示
す図である。
【図13】 赤一色で表された文字画像を含む文字領域
と、この文字領領域における明度のヒストグラムを示す
図である。
【図14】 黒と赤で表された文字画像を含む文字領域
と、この文字領領域における明度のヒストグラムを示す
図である。
【図15】 14(A)に示される文字領域における明
度値とその出現度数の変化量を示す第2のヒストグラム
を示す図である。
【図16】 図14(A)に示される文字領域を一文字
単位に分割して得られた分割領域の一例である。
【図17】 一文字分の文字画像が複数の色で表されて
いる場合の例を示す図である。
【符号の説明】
100…デジタル複写機、 101…CPU、 102…ROM、 103…RAM、 104…記憶部、 105…操作部、 106…ディスプレイ、 107…原稿読取部、 108…画像処理部、 109…印刷部、 110…インタフェース、 200…コンピュータ、 300…プリンタ。 400…ネットワーク。
フロントページの続き (51)Int.Cl.7 識別記号 FI テーマコート゛(参考) H04N 1/46 H04N 1/40 103A Fターム(参考) 5B057 AA11 BA02 BA30 CA01 CA08 CA12 CA16 CB01 CB06 CB12 CB16 CC03 CE12 CE16 CE18 CG01 DA08 DB02 DB06 DB09 DC19 DC25 DC36 5C077 LL19 MP08 PP27 PP28 PP32 PP34 PP37 PP38 PP47 PQ08 PQ12 PQ19 PQ20 PQ22 5C079 HB01 HB04 HB11 LA06 LA21 LA31 MA01 MA11 NA10 5L096 AA02 AA06 BA07 BA17 DA01 FA14 FA35 FA44 FA45 GA51

Claims (9)

    【特許請求の範囲】
  1. 【請求項1】 カラー画像データに基づいて複数文字分
    の文字画像を含む領域を抽出する領域抽出手段と、 カラー画像データを二値化して二値化画像データを得る
    二値化手段と、 抽出された領域内に含まれる複数文字分の文字画像が一
    つの色で表されているか複数の色で表されているかを判
    断する判断手段と、 抽出された領域内に含まれる複数文字分の文字画像が一
    つの色で表されていると判断される場合、当該一つの色
    に関する色情報を検出する検出手段と、 抽出された領域内に含まれる複数文字分の文字画像が一
    つの色で表されていると判断される場合、抽出された領
    域におけるカラー画像データを前記二値化手段によって
    二値化して得られる二値化画像データと前記領域におい
    て検出される前記色情報とを関連づけて記憶する記憶手
    段と、 を有することを特徴とする画像処理装置。
  2. 【請求項2】 さらに、抽出された領域内に含まれる複
    数文字分の文字画像が複数の色で表されていると判断さ
    れる場合、抽出された領域を当該領域よりもサイズが小
    さい複数の分割領域に分割する分割手段を有し、 前記判断手段は、さらに、前記分割手段によって得られ
    た一の分割領域内に含まれる文字画像が一つの色で表さ
    れているか複数の色で表されているかを判断し、 前記分割手段によって得られた一の分割領域内に含まれ
    る文字画像が一つの色で表されていると判断される場
    合、前記検出手段は、さらに、当該一つの色に関する色
    情報を検出するとともに、前記記憶手段は、前記一の分
    割領域におけるカラー画像データを前記二値化手段によ
    って二値化して得られる二値化画像データと前記一の分
    割領域において検出される前記色情報とを関連づけて記
    憶することを特徴とする請求項1に記載の画像処理装
    置。
  3. 【請求項3】 前記判断手段は、一の分割領域内に含ま
    れる文字画像が複数の色で表されていると判断した場
    合、前記分割手段は、さらに、前記一の分割領域を当該
    分割領域よりもサイズが小さい新たな複数の分割領域に
    分割することを特徴とする請求項2に記載の画像処理装
    置。
  4. 【請求項4】 前記分割手段は、複数文字分の文字画像
    を含む領域を一文字単位に分割するものであり、 前記判断手段が、一文字単位に領域を分割して得られた
    一の分割領域内に含まれる一文字分の文字画像が複数の
    色で表されていると判断する場合、前記記憶手段は、前
    記二値化画像データと前記色情報とを関連づけて記憶す
    る代わりに、前記一の分割領域におけるカラー画像デー
    タを記憶することを特徴とする請求項2に記載の画像処
    理装置。
  5. 【請求項5】 さらに、記憶手段によって記憶された内
    容を含むデータファイルをネットワークを通じて他の機
    器へ出力するファイル出力手段を有することを特徴とす
    る請求項1に記載の画像処理装置。
  6. 【請求項6】 さらに、原稿を読み取って前記カラー画
    像データを得るための読取手段を有することを特徴とす
    る請求項1に記載の画像処理装置。
  7. 【請求項7】 カラー画像データに基づいて複数文字分
    の文字画像を含む領域を抽出するステップと、 抽出された領域内に含まれる複数文字分の文字画像が一
    つの色で表されているか複数の色で表されているかを判
    断するステップと、 抽出された領域内に含まれる複数文字分の文字画像が一
    つの色で表されていると判断される場合、当該一つの色
    に関する色情報を検出するステップと、 抽出された領域内に含まれる複数文字分の文字画像が一
    つの色で表されていると判断される場合、抽出された領
    域におけるカラー画像データを二値化して得られる二値
    化画像データと前記領域において検出される前記色情報
    とを関連づけて記憶するステップと、 を有することを特徴とする画像処理方法。
  8. 【請求項8】 カラー画像データに基づいて複数文字分
    の文字画像を含む領域を抽出する手順と、 抽出された領域内に含まれる複数文字分の文字画像が一
    つの色で表されているか複数の色で表されているかを判
    断する手順と、 抽出された領域内に含まれる複数文字分の文字画像が一
    つの色で表されていると判断される場合、当該一つの色
    に関する色情報を検出する手順と、 抽出された領域内に含まれる複数文字分の文字画像が一
    つの色で表されていると判断される場合、抽出された領
    域におけるカラー画像データを二値化して得られる二値
    化画像データと前記領域において検出される前記色情報
    とを関連づけて記憶する手順と、 をコンピュータに実行させる画像処理プログラム。
  9. 【請求項9】 請求項8に記載の画像処理プログラムを
    記録したことを特徴とするコンピュータ読み取り可能な
    記録媒体。
JP2001254757A 2001-08-24 2001-08-24 画像処理装置、画像処理方法ならびに画像処理プログラムおよびこれを記録したコンピュータ読み取り可能な記録媒体 Expired - Fee Related JP3899872B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2001254757A JP3899872B2 (ja) 2001-08-24 2001-08-24 画像処理装置、画像処理方法ならびに画像処理プログラムおよびこれを記録したコンピュータ読み取り可能な記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001254757A JP3899872B2 (ja) 2001-08-24 2001-08-24 画像処理装置、画像処理方法ならびに画像処理プログラムおよびこれを記録したコンピュータ読み取り可能な記録媒体

Publications (2)

Publication Number Publication Date
JP2003069843A true JP2003069843A (ja) 2003-03-07
JP3899872B2 JP3899872B2 (ja) 2007-03-28

Family

ID=19082870

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001254757A Expired - Fee Related JP3899872B2 (ja) 2001-08-24 2001-08-24 画像処理装置、画像処理方法ならびに画像処理プログラムおよびこれを記録したコンピュータ読み取り可能な記録媒体

Country Status (1)

Country Link
JP (1) JP3899872B2 (ja)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005236697A (ja) * 2004-02-19 2005-09-02 Fuji Xerox Co Ltd 画像処理装置
JP2005260452A (ja) * 2004-03-10 2005-09-22 Fuji Xerox Co Ltd 画像処理装置
JP2005269269A (ja) * 2004-03-18 2005-09-29 Fuji Xerox Co Ltd 画像処理装置
US7660014B2 (en) 2006-01-17 2010-02-09 Konica Minolta Business Technologies, Inc. Image processing apparatus capable of extracting rule from document image with high precision
US7692669B2 (en) 2006-05-26 2010-04-06 Konica Minolta Business Technologies, Inc. Image processing apparatus, image processing method and image processing program
US7747089B2 (en) 2006-06-12 2010-06-29 Konica Minolta Business Technologies, Inc. Image processing apparatus, image processing method, and image processing program
CN101902549A (zh) * 2009-05-27 2010-12-01 夏普株式会社 图像处理装置及图像处理方法
US8208744B2 (en) 2006-01-23 2012-06-26 Konica Minolta Business Technologies, Inc. Image processing apparatus capable of accurately and quickly determining character part included in image
CN113744140A (zh) * 2020-10-16 2021-12-03 北京沃东天骏信息技术有限公司 一种图像处理方法、设备和计算机可读存储介质

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005236697A (ja) * 2004-02-19 2005-09-02 Fuji Xerox Co Ltd 画像処理装置
JP2005260452A (ja) * 2004-03-10 2005-09-22 Fuji Xerox Co Ltd 画像処理装置
JP2005269269A (ja) * 2004-03-18 2005-09-29 Fuji Xerox Co Ltd 画像処理装置
JP4507656B2 (ja) * 2004-03-18 2010-07-21 富士ゼロックス株式会社 画像処理装置
US7660014B2 (en) 2006-01-17 2010-02-09 Konica Minolta Business Technologies, Inc. Image processing apparatus capable of extracting rule from document image with high precision
US8208744B2 (en) 2006-01-23 2012-06-26 Konica Minolta Business Technologies, Inc. Image processing apparatus capable of accurately and quickly determining character part included in image
US7692669B2 (en) 2006-05-26 2010-04-06 Konica Minolta Business Technologies, Inc. Image processing apparatus, image processing method and image processing program
US7747089B2 (en) 2006-06-12 2010-06-29 Konica Minolta Business Technologies, Inc. Image processing apparatus, image processing method, and image processing program
CN101902549A (zh) * 2009-05-27 2010-12-01 夏普株式会社 图像处理装置及图像处理方法
JP2010277227A (ja) * 2009-05-27 2010-12-09 Sharp Corp 画像処理装置、画像処理方法、コンピュータプログラム及び記録媒体
US8606014B2 (en) 2009-05-27 2013-12-10 Sharp Kabushiki Kaisha Image Processing apparatus, extracting foreground pixels for extracted continuous variable density areas according to color information
CN113744140A (zh) * 2020-10-16 2021-12-03 北京沃东天骏信息技术有限公司 一种图像处理方法、设备和计算机可读存储介质

Also Published As

Publication number Publication date
JP3899872B2 (ja) 2007-03-28

Similar Documents

Publication Publication Date Title
JP4960897B2 (ja) 画像処理装置、画像処理方法、プログラム、記憶媒体
US8384964B2 (en) Image processing apparatus and image processing method
JP5219706B2 (ja) 画像処理装置、画像処理方法、及び、画像処理プログラム
US8395813B2 (en) Subtractive color method, subtractive color processing apparatus, image forming apparatus, and computer-readable storage medium for computer program
EP1871088A2 (en) Method and appparatus for image processing
US7626743B2 (en) Image processing apparatus, image processing method and image processing program for rendering pixels transparent in circumscribed areas
JP2007067932A (ja) 画像処理装置及びその方法
US7672008B2 (en) Image processing device, method and program product for separating character, halftone graphic, and halftone photographic regions
JP6705237B2 (ja) 画像圧縮装置、画像形成装置、画像圧縮方法およびプログラム
JP3899872B2 (ja) 画像処理装置、画像処理方法ならびに画像処理プログラムおよびこれを記録したコンピュータ読み取り可能な記録媒体
JP6607490B2 (ja) 変換処理装置、それを備えた情報処理装置、プログラム、及び記録媒体
US20090083318A1 (en) Device adaptively switching image processes in accordance with characteristic of object included in image
JP4165046B2 (ja) 画像処理装置、画像処理方法、画像処理プログラムおよび画像処理プログラムを記録したコンピュータ読取可能な記録媒体
JP2009296218A (ja) 領域判別方法、画像圧縮方法、画像圧縮装置、およびコンピュータプログラム
JP4710672B2 (ja) 文字色判別装置、文字色判別方法、およびコンピュータプログラム
JP3997696B2 (ja) 画像処理のための装置、方法及び記録媒体
JP2003219187A (ja) 画像処理方法及び画像処理装置
JP3899800B2 (ja) 画像処理装置、画像処理方法および画像処理プログラムを記録したコンピュータ読取可能な記録媒体
JP5549836B2 (ja) 画像処理装置及び画像処理方法
US11405525B2 (en) Image processing apparatus, control method, and product capable of improving compression efficiency by converting close color to background color in a low light reading mode
US11924390B2 (en) Apparatus, method, and storage medium for performing color reduction processing
JP2001309183A (ja) 画像処理装置および方法
JP2012098811A (ja) 画像処理装置、画像形成装置、画像処理制御装置、画像処理制御方法、コンピュータプログラム、及び、記録媒体
JP3882657B2 (ja) 画像処理装置、画像処理方法、画像処理プログラムおよび画像処理プログラムを記録したコンピュータ読み取り可能な記録媒体
JP2006262258A (ja) 画像処理装置、画像処理方法及びプログラム

Legal Events

Date Code Title Description
A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A712

Effective date: 20040423

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060228

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20060228

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060919

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20061110

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20061205

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20061218

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110112

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120112

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130112

Year of fee payment: 6

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees