JP2006180030A - 画像処理装置、画像処理方法および画像処理プログラム - Google Patents

画像処理装置、画像処理方法および画像処理プログラム Download PDF

Info

Publication number
JP2006180030A
JP2006180030A JP2004369070A JP2004369070A JP2006180030A JP 2006180030 A JP2006180030 A JP 2006180030A JP 2004369070 A JP2004369070 A JP 2004369070A JP 2004369070 A JP2004369070 A JP 2004369070A JP 2006180030 A JP2006180030 A JP 2006180030A
Authority
JP
Japan
Prior art keywords
region
area
attribute
data
band data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2004369070A
Other languages
English (en)
Other versions
JP4483567B2 (ja
Inventor
Hiroki Yoshida
宏樹 吉田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Konica Minolta Business Technologies Inc
Original Assignee
Konica Minolta Business Technologies Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Konica Minolta Business Technologies Inc filed Critical Konica Minolta Business Technologies Inc
Priority to JP2004369070A priority Critical patent/JP4483567B2/ja
Priority to US11/305,559 priority patent/US7529419B2/en
Publication of JP2006180030A publication Critical patent/JP2006180030A/ja
Application granted granted Critical
Publication of JP4483567B2 publication Critical patent/JP4483567B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/413Classification of content, e.g. text, photographs or tables

Abstract

【課題】 少ないメモリ容量で画像の属性を正確に判別する。
【解決手段】 MFPは、画像データを隣接するバンドデータが互いに重なる重複領域を有する複数のバンドデータに分割する画像分割部と、複数のバンドデータそれぞれから複数種類の属性別に領域を抽出する領域判別部と、複数のバンドデータのうち第1バンドデータから第1領域を抽出し、第2バンドデータから第2領域を抽出する誤判別判定部161と、第1領域と第2領域とは、重複領域で少なくとも一部が重複し、かつ、互いに属性が異なり、第1領域の特徴量を算出する第1特徴量算出部163と、第2領域の特徴量を算出する第2特徴量算出部165と、第1領域の特徴量と第2領域の特徴量とに基づき、第1領域の属性と第2領域の属性とのいずれか1つに決定する属性決定部167と、第1領域と第2領域の属性のうち決定された属性と異なる属性を決定された属性に変更する第1および第2補正部169A,169Bとを備える。
【選択図】 図5

Description

この発明は、画像処理装置、画像処理方法および画像処理プログラムに関し、特に、画像データを圧縮符号化するのに適した画像処理装置、画像処理方法および画像処理プログラムに関する。
従来、画像データを圧縮符号化する際に、圧縮効率を向上させるために画像データから文字、写真および図形の各属性領域を抽出して、属性領域ごとに圧縮符合化することが成されている。画像データから画像の属性を判別して属性領域を抽出する技術としては、例えば、特開平5−135202号公報がある。
一方、文字が表された文字属性の領域は、2値化して圧縮符号化することが望ましい。この2値化処理の処理速度を速くするために、専用のハードウェア回路が用いられることが多い。専用のハードウェア回路では、装置コストを低減するために比較的少ない容量のメモリが用いられ、画像データがバンドデータに分割されて2値化される。この2値化のためのハードウェア回路で処理単位のバンドデータに合わせて、写真が表された写真属性および図形が表された図形属性を処理すると、領域判別精度が劣化するといった問題がある。画像データのバンドデータへの分割は、画像データの内容に関わらず、データ量により分割されるため、文字、写真または図形が複数のバンドデータに分割される場合がある。このため、例えば、文字が一方のバンドデータでは文字と判別されるが、他方のバンドデータでは文字と判別されない場合がある。誤って領域の属性が判別されると、圧縮効率が低下してしまう。
特開平5−135202号公報
この発明は上述した問題点を解決するためになされたもので、この発明の目的の1つは、少ないメモリ容量で画像の属性を正確に判別することが可能な画像処理装置を提供することが可能な画像処理装置、画像処理方法および画像処理プログラムを提供することである。
この発明の他の目的は、画質の劣化を少なくして画像データを圧縮することが可能な画像処理装置を提供することができる。
上述した目的を達成するためにこの発明のある局面によれば、画像処理装置は、画像データを隣接するバンドデータが互いに重なる重複領域を有する複数のバンドデータに分割する分割手段と、複数のバンドデータそれぞれから複数種類の属性別に領域を抽出する領域判別手段と、複数のバンドデータは、重複領域を有する第1バンドデータおよび第2バンドデータとを含み、第1バンドデータから抽出された領域のうちから第1領域を抽出し、第2バンドデータから抽出された領域のうちから第2領域を抽出する領域抽出手段と、第1領域と第2領域とは、重複領域で少なくとも一部が重複し、かつ、互いに属性が異なり、抽出された第1領域の特徴量を算出する第1特徴量算出手段と、抽出された第2領域の特徴量を算出する第2特徴量算出手段と、第1領域の特徴量と第2領域の特徴量とに基づき、第1領域の属性と第2領域の属性とのいずれか1つに決定する属性決定手段と、第1領域の属性と第2領域の属性のうち決定された属性と異なる属性を決定された属性に変更する補正手段とを備える。
この発明に従えば、画像データを隣接するバンドデータが互いに重なる重複領域を有する複数のバンドデータに分割して属性領域を抽出するので、少ないメモリ容量で処理することができる。また、重複領域で重複している属性領域が、2つのバンドデータで異なる属性の属性領域として抽出されたことを検出することができる。さらに、重複領域で少なくとも一部が重複し、かつ、互いに属性が異なる第1領域と第2領域とが、第1バンドデータおよび第2バンドデータそれぞれから抽出され、第1領域の特徴量と第2領域の特徴量とに基づき、1つの属性が決定される。このため、重複領域で異なる領域でありながら第1バンドデータと第2バンドデータとで異なる属性と判別された2つの領域の属性がいずれか一つに決定される。この結果、少ないメモリ容量で画像の属性を正確に判別することが可能な画像処理装置を提供することができる。
好ましくは、第1特徴量算出手段は、画像データの第1領域に含まれる画素の画素値に基づいてヒストグラムを生成する第1生成手段を含み、生成されたヒストグラムのピーク値の数に基づいて第1特徴量を算出し、第2特徴量算出手段は、画像データの第2領域に含まれる画素の画素値に基づいてヒストグラムを生成する第2生成手段を含み、生成されたヒストグラムのピーク値の数に基づいて第2特徴量を算出する。
好ましくは、属性決定手段は、第1領域の特徴量と第2領域の特徴量それぞれに、属性に応じて予め定められた第1重付係数を乗じた値を比較する比較手段を含む。
好ましくは、比較手段は、第1領域の特徴量と第2領域の特徴量それぞれに、属性ごとに重複領域の幅に応じて予め定められた第2重付係数をさらに乗じた値を比較する。
好ましくは、属性決定手段は、第1領域と該第1領域が重複領域に含まれる領域との比率に応じて第3重付係数を決定する第3重付係数決定手段と、第2領域と該第2領域が重複領域に含まれる領域との比率に応じて第4重付係数を決定する第4重付係数決定手段とをさらに含み、比較手段は、第1領域の特徴量に、第3重付係数をさらに乗じた値と、2領域の特徴量に第4重付係数をさらに乗じた値とを比較する。
好ましくは、属性別に抽出された領域が入力され、入力された領域のうち重複領域で重複し、属性が同じ2つの領域を統合する統合手段と、統合手段により統合された領域および統合手段により統合されなかった領域ごとに、属性に対応して予め定められた圧縮方式で画像データを圧縮符号化する圧縮手段をさらに備える。
この発明に従えば、圧縮方式に適した領域を抽出することができるので、画質が劣化するのを少なくして画像データを圧縮することが可能な画像処理装置を提供することができる。
この発明のさらに他の局面によれば、画像処理方法は、画像データを隣接するバンドデータが互いに重なる重複領域を有する複数のバンドデータに分割するステップと、複数のバンドデータそれぞれから複数種類の属性別に領域を抽出するステップと、複数のバンドデータは、重複領域を有する第1バンドデータおよび第2バンドデータとを含み、第1バンドデータから抽出された領域のうちから第1領域を抽出し、第2バンドデータから抽出された領域のうちから第2領域を抽出するステップと、第1領域と第2領域とは、重複領域で少なくとも一部が重複し、かつ、互いに属性が異なり、抽出された第1領域の特徴量を算出するステップと、抽出された第2領域の特徴量を算出するステップと、第1領域の特徴量と第2領域の特徴量とに基づき、第1領域の属性と第2領域の属性とのいずれか1つに決定するステップと、第1領域の属性と第2領域の属性のうち決定された属性と異なる属性を決定された属性に変更するステップとを含む。
この発明のさらに他の局面によれば、画像処理プログラムは、画像データを隣接するバンドデータが互いに重なる重複領域を有する複数のバンドデータに分割するステップと、複数のバンドデータそれぞれから複数種類の属性別に領域を抽出する領域判別手段と、複数のバンドデータは、重複領域を有する第1バンドデータおよび第2バンドデータとを含み、第1バンドデータから抽出された領域のうちから第1領域を抽出し、第2バンドデータから抽出された領域のうちから第2領域を抽出するステップと、第1領域と第2領域とは、重複領域で少なくとも一部が重複し、かつ、互いに属性が異なり、抽出された第1領域の特徴量を算出するステップと、抽出された第2領域の特徴量を算出するステップと、第1領域の特徴量と第2領域の特徴量とに基づき、第1領域の属性と第2領域の属性とのいずれか1つに決定するステップと、第1領域の属性と第2領域の属性のうち決定された属性と異なる属性を決定された属性に変更するステップとをコンピュータに実行させる。
この発明に従えば、少ないメモリ容量で画像の属性を正確に判別することが可能な画像処理プログラムを提供することができる。
以下、図面を参照しつつ本発明の実施の形態について説明する。以下の説明では、同一の部品には同一の符号を付してある。それらの名称および機能も同じである。したがってそれらについての詳細な説明は繰返さない。
図1は、本発明の実施の形態の1つにおけるMFPの概略構成を示す模式的断面図である。図1を参照して、MFP(Multi Function Peripheral)1は、原稿から画像データを読取るスキャナ部11と、用紙上に画像を印刷するプリンタ部12とを含む。
スキャナ部11の原稿台13上に載置された原稿は、スキャナ14の備える露光ランプ15により照射される。スキャナ14は、スキャナモータ22により矢印方向に移動して原稿全体を走査する。原稿面からの反射光は、ミラー16〜18および集光レンズを介してCCD(Charge Coupled Device)20上に像を結ぶ。CCD20は、原稿面からの反射光をRGBの色データ(アナログ信号)に変換してスキャナ制御部21に出力する。CCD20がスキャナ制御部21に出力する色データを、画像データという。
スキャナ制御部21は、CCD20から入力される画像データに所定の画像処理を施してプリンタ制御部31にデジタル信号を出力する。
ここでスキャナ制御部21からプリンタ制御部31に出力されるデジタル信号は、シアン用の画像色データCと、マゼンタ用の画像色データMと、イエロー用の画像色データYと、ブラック用の画像色データKである。プリンタ制御部31は、入力された画像色データC,M,Y,Kに基づいて、シアン、マゼンタ、イエロー、ブラックそれぞれの感光体ドラム35C,35M,35Y,35Kにレーザビームを出力する。
プリンタ部12において、スキャナ制御部21から出力されるレーザビームは、帯電チャージャ34C,34M,34Y,34Kによって帯電された感光体ドラム35C,35M,35Y,35Kを露光し、静電潜像を形成する。シアン、マゼンタ、イエロー、およびブラックの4色の現像器36C,36M,36Y,36Kにより、感光体ドラム35C,35M,35Y,35K上の静電潜像が現像される。
一方、無端ベルト40は、駆動ローラ43Aと固定ローラ43B,43C,43Dとにより弛まないように懸架されている。駆動ローラ43Aが図中で反時計回りに回転すると、無端ベルト40が所定速度で図中で反時計回りに回転する。
給紙カセット50〜52より適当な用紙が搬送され、タイミングローラ41から無端ベルト40に用紙が供給される。無端ベルト40に供給された用紙は、無端ベルト40上に担持され、図中で左方向に搬送される。これにより、用紙がシアン、マゼンタ、イエロー、ブラックの順に感光体ドラム35C,35M,35Y,35Kと接触する。用紙がそれぞれの感光体ドラム35C,35M,35Y,35Kと接触したときに、感光体ドラムと対をなす転写チャージャ37C,37M,37Y,37Kにより感光体ドラム上に現像されたトナー像が用紙に転写される。
トナー像が転写された用紙は、定着ローラ対42により加熱される。これにより、トナーは溶かされて用紙に定着する。その後、用紙はプリンタ部12から排出される。
また、MFP1は、ネットワークに接続された他の機器と通信するためのネットワークコントローラ、ファクシミリ、およびハードディスクを含み、上述した画像読取機能および画像形成機能に加えて、電子メール送受信機能、ファイル転送機能、ファクシミリ送受信機能、データをプリントするプリント機能、ファイル蓄積機能を備えている。
図2は、本実施の形態におけるMFPの回路構成を示すブロック図である。図2を参照して、MFP1は、MFP1の全体を制御するためのCPU101と、CPU101とCPUバス102を介して接続されたバスブリッジ103と、バスブリッジ103に接続されたROM105およびRAM107と、バスブリッジ103にそれぞれ汎用バス104を介して接続された画像制御部110と、2値化処理回路112と、操作パネルインターフェース(IF)121と、ネットワークインターフェース(IF)123と、メモリインターフェース(IF)125とを含む。
操作パネルIF121は、操作パネル122と接続されており、ネットワークIF123は、ネットワークに接続されており、メモリIF125にはフラッシュROM126が装着可能である。
画像制御部110には、画像バス111を介して、画像メモリ113と、スキャナインターフェース(IF)115と、プリンタインターフェース(IF)117と、ハードディスクユニット119とが接続されている。スキャナIF115はスキャナ制御部21が接続されており、プリンタIF117はプリンタ制御部31が接続されている。
ネットワークIF123は、ネットワークと接続され、MFP1を他のコンピュータとネットワークを介して接続する。ネットワークIF123は、CPU101から入力されたデータをネットワークに送出し、ネットワークから受信されたデータをCPU101に出力する。
画像制御部110は、CPU101によって制御され、画像データの入出力を制御する。ネットワークIF123を介して他のコンピュータから受信された画像データ、スキャナIFから入力される画像データまたはハードディスクから読出された画像データを、プリンタ制御部31またはハードディスクユニット119に出力する。また、画像制御部110は、画像データをプリンタ制御部31に出力する際には、画像データをプリンタ部12でプリント可能なプリントデータに変換する処理を行なう。
2値化処理回路112は、CPU101により制御され、画像データが入力されると、画像データを所定のアルゴリズムに従って文字が表された文字領域を2値化処理して2値化データを出力する。所定のアルゴリズムに従った処理は、画像データの文字が表された領域を2値化した2値化データを出力するものであれば、周知のアルゴリズムを用いればよい。また所定のアルゴリズムは、画素の属性を判別する処理、エッジ強調処理等を含む。2値化処理回路112は、処理速度が高速であることが求められるため、ハードウェアで構成される。2値化処理回路112は、作業エリアとして不揮発性のメモリを有しており、画像データが部分的に入力される。RAMに記憶可能な画像データは、画像データの数ラインから数十ラインである。このため、メモリコストが抑えられている。2値化処理回路112で実行される2値化処理は、画素ごとに文字属性か否かを判別して、文字属性と判別された画素の値のみを2値化する処理であってもよいし、画素ごとに文字属性か否かを判別した後、文字属性と判別された画素の外接矩形の文字領域に含まれる全ての画素の値を2値化する処理であってもよい。
操作パネル122は、ユーザによる操作の入力を受付けるための入力部と、情報を表示するための表示部とを含む。
ハードディスクユニット119は、スキャナで読取られた画像データ、その画像データを圧縮符号化した圧縮データ、ネットワークIF123で他のコンピュータから受信された画像データ、その画像データの圧縮データなど、MFP1に入力されるデータを記憶する。
メモリIF125には、フラッシュROM126が装着される。このフラッシュROM126に記憶された画像処理プログラムが、CPU101で実行される。なお、プログラムを、フラッシュROM126から読み出すのに代えて、EEPROM(electrically erasable/programable read only memory)に記憶するようにしてもよい。CPU101は、EEPROMに記憶されたプログラムを実行する。またこのEEPROMは、記憶内容を書換えるまたは追加して書込みすることが可能なので、ネットワークに接続された他のコンピュータが、MFP1のEEPROMに記憶されたプログラムを書換えたり、新たなプログラムを追加して書込んだりするようにしてもよい。さらに、MFP1が、ネットワークに接続された他のコンピュータからプログラムをダウンロードして、そのプログラムをEEPROMに記憶するようにしてもよい。
ネットワークは、ローカルエリアネットワーク(LAN)であってもよいし、インターネットまたは一般公衆回線であってもよく、有線または無線を問わない。
なお、MFP1で実行される画像処理プログラムはフラッシュROM126に記憶されて流通される例を示すが、他の記録媒体、たとえば、フレキシブルディスク、カセットテープ、CD−ROM(Compact Disc - Read Only Memory)、ハードディスク、光ディスク(MO(Magnetic Optical Disc)/MD(Mini Disc)/DVD(Digital Versatile Disc))、ICカード(メモリカードを含む)、光カード、マスクROM、EPROM、EEPROMなどの半導体メモリ等の固定的にプログラムを担持する媒体でもよい。さらに、ネットワークを介して他の装置からダウンロードされる場合であってもよい。
また、ここでいうプログラムは、CPU101により直接実行可能なプログラムだけでなく、ソースプログラム形式のプログラム、圧縮処理されたプログラム、暗号化されたプログラム等を含む。
本実施の形態におけるMFP1は、画像データを符号化して圧縮する処理を実行する。圧縮処理の対象となる画像データは、スキャナ部11で読取られた画像データ、ネットワークIF123で他のコンピュータから受信された画像データ、ハードディスクユニット119から読出された画像データを含む。また、画像データは、フルカラーの画像データ、モノクロで多値の画像データを含む。
圧縮方式は、PDF(Portable Document Format)、JPEG(Joint Photographic Experts Group)、フレート圧縮、ファクシミリ通信に用いられるG4規格で定められた圧縮方式等一般的な圧縮方式を含む。複数の圧縮方式のうちからいずれを選択するかは、ユーザが操作パネル122に表示された選択画面で、圧縮方式を選択する指示を入力することにより受付けられる。CPU101で圧縮処理された圧縮データは、ハードディスクユニット119の所定の領域に記憶される。画像データのうち文字領域は、2値化して圧縮符号化すると画質が向上し、圧縮効率が上がる。このため、CPU101は、画像データのうち文字領域のみを抽出して圧縮する。CPU101は、圧縮処理を高速に実行するため、画像データから文字領域を抽出して2値化する処理を、2値化処理回路112に実行させる。
2値化処理回路は、上述したように、作業領域として使用可能なメモリ容量が制限されていることから文字領域の判別精度に限界がある。作業領域のメモリ容量が制限されているために、画像データの一部が処理対象となる。2値化処理回路112で記憶可能な画像データは、たとえば、画像データの数〜数十ラインであり、処理対象とされる画像データの一部はバンドデータと呼ばれる。2値化処理回路112で実行する2値化処理には、バンドデータごとに文字領域を抽出する処理が含まれる。たとえば、文字領域が2つのバンドデータに分割される場合を例に説明すると、一方のバンドデータでは文字と判別され、他方のバンドデータでは文字と判別するべき領域を誤って写真と判別される場合がある。他方のバンドデータに、文字に隣接して写真が含まれている場合などに誤判別されることが多い。また、1つの文字が2つのバンドデータに分割される場合も誤判別されることが多い。画素の属性が誤って判別されると、その画素が2値化されないので、文字が欠けたり擦れたりする。
図3は、本実施の形態におけるCPU101の機能を示す機能ブロック図である。図3を参照して、CPU101は、画像データを複数のバンドデータに分割する画像分割部151と、バンドデータが順に入力され、バンドデータごとに写真属性と文字属性の領域を抽出する領域判別部153と、合成領域データ生成部155と、文字データ合成部159と、画像データを圧縮符号化する圧縮部157とを含む。
画像分割部151には、画像データが入力される。画像分割部151は、画像データをバンドデータに分割する。画像分割部151が分割するバンドデータは、隣接するバンドデータが所定の重複領域を有する。バンドデータのサイズは、予め定めておいてもよいし、2値化処理回路112で処理可能なデータ量に応じて定めるようにしても良い。バンドデータは、2値化処理回路112、領域判別部153および合成領域データ生成部155に出力される。バンドデータは、その順番とともにRAM107に記憶され、2値化処理回路112、領域判別部153および合成領域データ生成部155により読出される。
ここで、バンドデータについて説明する。図4は、バンドデータの一例を示す図である。図4を参照して、画像データ200を3つのバンドデータ201A、201B,201Cに分割した例を示している。バンドデータ201Aの下部と、バンドデータ201Bの上部とが重複しており、バンドデータ201A、201Bそれぞれが共通の重複領域を有する。バンドデータ201Bの下部と、バンドデータ201Cの上部とが重複しており、バンドデータ201B、201Cそれぞれが共通の重複領域を有する。
画像データ200は、文字の表された文字領域と、写真の表された写真領域を含む。図では、文字を記号Xで示し、写真を○印で示している。以下、説明のためバンドデータ201Aを第1バンドデータ、バンドデータ201Bを第2バンドデータ、バンドデータ201Cを第3バンドデータという。
図3に戻って、領域判別部153は、バンドデータから写真属性の領域と、図形属性の領域を抽出し、写真属性の領域のバンドデータにおける位置とサイズを示す写真領域データと、図形属性の領域のバンドデータにおける位置とサイズを示す図形領域データとを合成領域データ生成部155に出力する。写真領域データは、バンドデータと同じサイズであり、写真属性の画素の値を「1」とし他の画素の値を「0」とするデータである。図形領域データ、バンドデータと同じサイズであり、図形属性の画素の値を「1」とし他の画素の値を「0」とするデータである。写真属性データと図形属性データとは、その順番とともにRAM107に記憶され、合成領域データ生成部155により読出される。
以下、説明のため第1、第2および第3バンドデータに対応する写真領域データを、第1、第2および第3写真領域データといい、第1、第2および第3バンドデータに対応する図形領域データを、第1、第2および第3図形領域データという。
なお、領域判別部153と2値化処理回路とで領域抽出部154が構成される。また、2値化処理回路112を設けることなく、CPU101でバンドデータを2値化する処理を実行するようにしてもよい。この場合には、領域判別部153は、バンドデータから写真属性の領域と、図形属性の領域の抽出に加えて、文字属性の領域を抽出し、さらに、写真属性の領域のバンドデータにおける位置とサイズを示す写真領域データと、図形属性の領域のバンドデータにおける位置とサイズを示す図形領域データと出力するのに加えて、文字属性の領域のバンドデータにおける位置とサイズを示す文字領域データを出力する。
合成領域データ生成部155は、文字領域データ、写真領域データおよび図形領域データが入力される。2値化処理回路112が出力する文字領域データは、バンドデータと同じサイズであり、文字属性の画素の値を「1」とし他の画素の値を「0」とするデータである。文字領域データは、2値化処理回路112から出力されてRAM107に記憶され、合成領域データ生成部155により読出される。以下、説明のため第1、第2および第3バンドデータに対応する文字領域データを、第1、第2および第3文字領域データという。
図5は、合成領域データ生成部155の詳細な構成を示すブロック図である。合成領域データ生成部155は、属性判別が誤ってされた第1領域と第2領域とを抽出するための誤判別判定部161と、第1領域から第1特徴量を算出する第1特徴量算出部163と、第2領域から第2特徴量を算出する第2特徴量算出部165と、第1特徴量および第2特徴量から属性を決定する属性決定部167と、決定された属性に従って文字領域データ、写真領域データおよび図形領域データを補正する第1補正部169Aおよび第2補正部169Bと、補正された文字領域データ、写真領域データおよび図形領域データを合成して合成領域データを生成する合成部171とを含む。
ここでは説明のため、第1バンドデータおよび第2バンドデータに対して実行される処理について説明する。第2バンドデータと第3バンドデータに対して実行される処理も同様であるのでここでは説明を繰返さない。
誤判別判定部161は、第1バンドデータ201Aと第2バンドデータ201Bとの重複領域202Aにおいて、異なる属性と判定された誤判別領域を抽出する。具体的には、次の場合がある。
(1) 第1文字領域データの重複領域で画素値が「1」の画素が、第2写真領域データで画素値が「1」となる場合、または、第2図形領域データで画素値が「1」となる場合に、その画素を誤判別領域に含まれる画素として抽出する。第1文字領域データから抽出された誤判別領域を含む文字領域を第1領域として第1特徴量算出部163に出力し、第2写真領域データまたは第2図形領域データから抽出された誤判別領域を含む写真領域または図形領域を第2領域として第2特徴量算出部165に出力する。
(2) 第1写真領域データの重複領域で画素値が「1」の画素が、第2文字領域データで画素値が「1」となる場合、または、第2図形領域データで画素値が「1」となる場合に、その画素を誤判別領域に含まれる画素として抽出する。第1写真領域データから抽出された誤判別領域を含む写真領域を第1領域として第1特徴量算出部163に出力し、第2文字領域データまたは第2図形領域データから抽出された誤判別領域を含む文字領域または図形領域を第2領域として第2特徴量算出部165に出力する。
(3) 第1図形領域データの重複領域で画素値が「1」の画素が、第2文字領域データで画素値が「1」となる場合、または、第2写真領域データで画素値が「1」となる場合に、その画素を誤判別領域に含まれる画素として抽出する。第1図形領域データから抽出された誤判別領域を含む図形領域を第1領域として第1特徴量算出部163に出力し、第2文字領域データまたは第2写真領域データから抽出された誤判別領域を含む文字領域または写真領域を第2領域として第2特徴量算出部165に出力する。
第1特徴量算出部163は、第1領域が入力され、第1バンドデータをRAM107から読出す。第1特徴量算出部163は、第1バンドデータの第1領域に含まれる画素の値から第1特徴量を算出し、属性決定部167に出力する。第1特徴量は、第1バンドデータの第1領域に含まれる画素の輝度値のヒストグラムを作成し、作成したヒストグラムのピーク値の数をしきい値と比較する。画像の性質からピーク値が少ない領域が写真属性であり、中程度であれば図形属性であり、多い領域が文字属性と判断できる。
第2特徴量算出部165は、第2領域が入力され、第2バンドデータをRAM107から読出す。第2特徴量算出部165は、第2バンドデータの第2領域に含まれる画素の値から第2特徴量を算出し、属性決定部167に出力する。
属性決定部167は、第1特徴量と第2特徴量とから第1領域の属性と第2領域の属性のいずれかに決定する。この決定方法については後述する。
第1補正部169Aは、属性決定部167で決定された属性が、第1領域の属性と異なる場合に、第1領域の属性を決定された属性に補正する。具体的には、次の処理が行なわれる。
(1) 第1領域が文字属性で、決定された属性が写真属性の場合。第1文字領域データの第1領域に含まれる画素の値を「0」とし、第1写真領域データの第1領域に含まれる画素の値を「1」とする。第1領域が文字属性で、決定された属性が図形属性の場合。第1文字領域データの第1領域に含まれる画素の値を「0」とし、第1図形領域データの第1領域に含まれる画素の値を「1」とする。
(2) 第1領域が写真属性で、決定された属性が文字属性の場合。第1写真領域データの第1領域に含まれる画素の値を「0」とし、第1文字領域データの第1領域に含まれる画素の値を「1」とする。第1領域が写真属性で、決定された属性が図形属性の場合。第1写真領域データの第1領域に含まれる画素の値を「0」とし、第1図形領域データの第1領域に含まれる画素の値を「1」とする。
(3) 第1領域が図形属性で、決定された属性が文字属性の場合。第1図形領域データの第1領域に含まれる画素の値を「0」とし、第1文字領域データの第1領域に含まれる画素の値を「1」とする。第1領域が図形属性で、決定された属性が写真属性の場合。第1図形領域データの第1領域に含まれる画素の値を「0」とし、第1写真領域データの第1領域に含まれる画素の値を「1」とする。
第2補正部169Bは、属性決定部167で決定された属性が、第2領域の属性と異なる場合に、第2領域の属性を決定された属性に補正する。具体的には、次の処理が行なわれる。
(1) 第2領域が文字属性で、決定された属性が写真属性の場合。第2文字領域データの第2領域に含まれる画素の値を「0」とし、第2写真領域データの第2領域に含まれる画素の値を「1」とする。第2領域が文字属性で、決定された属性が図形属性の場合。第2文字領域データの第2領域に含まれる画素の値を「0」とし、第2図形領域データの第2領域に含まれる画素の値を「1」とする。
(2) 第2領域が写真属性で、決定された属性が文字属性の場合。第2写真領域データの第2領域に含まれる画素の値を「0」とし、第2文字領域データの第2領域に含まれる画素の値を「1」とする。第2領域が写真属性で、決定された属性が図形属性の場合。第2写真領域データの第1領域に含まれる画素の値を「0」とし、第2図形領域データの第1領域に含まれる画素の値を「1」とする。
(3) 第2領域が図形属性で、決定された属性が文字属性の場合。第2図形領域データの第1領域に含まれる画素の値を「0」とし、第2文字領域データの第2領域に含まれる画素の値を「1」とする。第2領域が図形属性で、決定された属性が写真属性の場合。第2図形領域データの第1領域に含まれる画素の値を「0」とし、第2写真領域データの第2領域に含まれる画素の値を「1」とする。
以上第1バンドデータから第3バンドデータの全てに対して処理が実行されると、RAM107には、第1〜第3バンドデータ、第1〜第3文字領域データ、第1〜第3写真領域データ、第1〜第3図形領域データが記憶される。
合成部171は、RAMから第1〜第3文字領域データ、第1〜第3写真領域データおよび第1〜第3図形領域データを読出して、これらの全てを合成した合成領域データを生成する。合成領域データは、たとえば、文字領域に含まれる画素の値を「1」とし、写真領域に含まれる画素の値を「2」とし、図形領域に含まれる画素の値を「3」としたデータである。
図3に戻って、文字データ合成部159は、2値化処理回路112から文字データが入力される。文字データは、文字領域を2値化したデータであり、バンドデータとサイズが同じである。文字データ合成部159は、文字データを入力された順に合成して、合成2値化データをRAM107に記憶する。この際、重複領域は、後から入力されたデータが優先される。合成2値化データは、画像データとサイズが同じである。
文字データ合成部159は、合成2値化データに含まれる画素値が「1」の画素で、合成領域データで文字属性とされていない画素の画素値を「0」に変更する。また、文字データ合成部159は、合成2値化データに含まれる画素値が「0」の画素で、合成領域データで文字属性とされている画素からなる画素群を抽出し、その画素群を構成する領域については、バンドデータを2値化して、2値化した値に変更する。
圧縮部157は、RAM107から画像データと、合成領域データと、合成2値化データとを読出し、領域ごとに圧縮符号化する。合成領域データを参照しながら複数ある領域を順に特定し、その属性に応じた圧縮パラメータを設定して、属性に応じた圧縮方式で圧縮符号化する。たとえば、属性が文字の文字領域については、合成2値化データの対応する文字領域の2値化データを、G4圧縮方式で圧縮符号化する。また、属性が写真の写真領域については、画像データの対応する写真領域のデータを、JPEG圧縮方式で圧縮符号化する。また、属性が図形の図形領域については、画像データの対応する図形領域のデータを、フレート圧縮方式で圧縮符号化する。
そして、領域ごとに圧縮符号化されたデータを、1つの圧縮データにまとめてそれをRAM107に記憶する。圧縮データは、領域ごとに圧縮されたデータの圧縮方式と画像データ中の位置情報とを含む。
次に、属性決定部167で属性を決定する処理について説明する。図6は、バンドデータを示す別の図である。図6(A)は第1バンドデータを示し、図6(B)は第2バンドデータを示す。図6(A)を参照して、第1バンドデータ201Aは、第2バンドデータ201Bと共通の重複領域202Aを含む。第1バンドデータ201Aは、文字の表された文字領域と、写真の表された写真領域の一部とを含む。写真領域は、文字領域の近傍に位置し、文字領域の面積に比べてその面積が小さい。この第1バンドデータ201Aを2値化処理回路112で2値化処理すると、写真領域が文字領域として誤って判別される場合がある。図6では、誤って判別された文字領域203を示している。写真領域の一部が誤って文字領域に含まれている。
図6(B)を参照して、第2バンドデータ201Bは、第1バンドデータ201Aと共通の重複領域202Bを含む。第2バンドデータ201Bは、写真の表された写真領域の全てを含む。
図6(A)および図6(B)に示した第1および第2バンドデータ201A,201Bに対する処理を例に具体的に説明する。
2値化処理回路112は、第1バンドデータ201Aが入力されると、文字領域203に含まれる画素の値を「1」とし、他の画素の値を「0」とした文字領域データを出力する。また、領域判別部153は、第1バンドデータ201Aが入力されると、全ての画素の値を「0」とした写真領域データおよび図形領域データを出力する。
2値化処理回路112は、第2バンドデータ201Bが入力されると、写真領域は文字領域として判別されず、全ての画素値の値を「0」とした文字領域データを出力する。領域判別部153は、第2バンドデータ201Bが入力されると、写真領域204に含まれる画素の値を「1」、他の画素の値を「0」とした写真領域データと、全ての画素の値を「0」とした図形領域データを出力する。
誤判別判定部161では、第1バンドデータ201Aの重複領域202Aと、第2バンドデータ201Bの重複領域202Bとで、第1文字領域データおよび第2写真領域データとを比較して、文字領域203と写真領域204とが重複する領域を誤判別領域として抽出する。そして、誤判別判定部161は、誤判別領域を含む文字領域203を第1領域として第1文字領域データから抽出し、誤判別領域を含む写真領域204を第2領域として第2写真領域データから抽出する。
第1特徴量算出部163は、第1バンドデータ201Aの文字領域203に含まれる画素の値から特徴量を算出する。第2特徴量算出部165は、第2バンドデータ201Bの写真領域204に含まれる画素の値から特徴量を算出する。
ここで、特徴量について説明する。特徴量Fは、領域に含まれる画素の値から算出される。特徴量は、領域に含まれる画素の輝度値のヒストグラムさから求められる。このため、文字、写真および図形の別を1つの特徴量で判別することができる。ヒストグラムの幅をn、輝度値iの画素の度数をh[i]とすると、特徴量Fは次式(1)で求められる。
Figure 2006180030
この特徴量は、ヒストグラムの頂点の数が大きいほど小さな値となる。画像の性質として、写真領域は、ヒストグラムでなだらかな勾配を有するため、ピーク値の数が少ない。文字領域は、ヒストグラムで1つのピーク値を持つ。図形領域は、ピーク値が複数存在する。このため、2つのしきい値を設けて特徴量から、文字、図形および写真の属性を判定することができる。特徴量は、ピーク値ch1の割合の逆数である。このため、特徴量は、写真属性の領域、文字属性の領域、図形属性の領域の順に小さな値となる。
ここで、第1特徴量算出部163により算出される、第1バンドデータ201Aの文字領域203の特徴量をF1、第2特徴量算出部165により算出される、第2バンドデータ201Bの写真領域204の特徴量をF2とする。
属性決定部167は、この特徴量F1,F2と、第1重付係数Coef(属性)と、第2重付係数Weight(属性,重複幅)とに基づき、式(2)を用いて評価値Eを求める。第1重付係数Coef(属性)は、領域の属性に応じて予め定められた係数である。第2重付係数Weight(属性,重複幅)は、領域の属性および重複領域の幅(ライン数)に応じて予め定められた係数である。
E=F1×Coef(文字)×Weight(文字,小)+F2×Coef(写真)×Weight(写真,小) … (2)
属性決定部167は、評価値Eが予め定められたしきい値Tよりも大きい場合に、写真属性に決定し、しきい値T以下の場合に文字属性として判定する。ここでは、文字属性の文字領域203と、写真属性の写真領域204を例に説明したが、他の属性の領域の組合せでも、同様に式(1)を用いて特徴量Fを求め、その特徴量から式(2)を用いて評価値Eを求め、しきい値Tと比較することにより属性を決定することができる。この際、評価値Eが大きいほど、写真属性、図形属性、文字属性の順に属性を決定すればよい。即ち、写真属性の領域と図形属性の領域との組合せにあっては、評価値Eがしきい値Tより大きい場合に写真属性に決定し、評価値Eがしきい値Tより小さい場合に写真属性に決定する。図形属性の領域と文字属性の領域との組合せにあっては、評価値Eがしきい値Tより大きい場合に図形属性に決定し、評価値Eがしきい値Tより小さい場合に文字属性に決定する。
(1)属性決定部167で、写真属性に決定された場合。
第1バンドデータの第1領域(文字領域)の属性が、属性決定部167で決定された属性と異なる。この場合には、第1補正部169Aは、第1文字領域データの第1領域に含まれる画素の値をすべて「0」に置換え、第1写真領域データの第1領域に含まれる画素の値をすべて「1」に置換える。第2補正部169Bは、何もしない。
(2)属性決定部167で、文字属性に決定された場合。
第2バンドデータの第2領域(写真領域)の属性が、属性決定部167で決定された属性と異なる。この場合には、第1補正部169Aは何もすることなく、第2補正部169Bは、第2写真領域データの第2領域に含まれる画素の値をすべて「0」に置換える。
図7は、第1重付係数テーブルの一例を示す図である。第1重付係数テーブルは、プログラムとともにフラッシュROM126から読み出されてRAM107に記憶されており、必要なタイミングでCPU101に読出される。図7を参照して、第1重付係数テーブルは、属性ごとに第1重付係数Coefを定義する。換言すれば、第1重付係数Coefは、属性に応じて異なる値とされる。図では、第1重付係数Coefは、写真属性に対して値が「10」が定義され、図形属性に対して値が「1」が定義され、文字属性に対して値が「2」が定義される。第1重付係数Coefは、写真属性に対応する値がもっとも大きく、次に文字属性に対応する値が大きく、図形属性に対応する値が最も小さい。写真属性の領域は、分割される領域が小さくなると属性を判定する精度が低くなる。このため、属性が写真の属性には大きな値の重付係数が定義される。
図8は、第2重付係数テーブルの一例を示す図である。第2重付係数テーブルは、プログラムとともにフラッシュROM126から読み出されてRAM107に記憶されており、必要なタイミングでCPU101に読出される。図8を参照して、第2重付係数テーブルは、属性ごとおよび重ね幅ごとに第2重付係数Weightを定義する。換言すれば、第1重付係数Coefは、属性および重ね幅に応じて定まる値とされる。重ね幅は、重複領域の幅(ライン数)である。図では、重ね幅が小さい場合に、第2重付係数Weightは、写真属性、図形属性、文字属性すべてに同じ値「1」が定義される。重ね幅が大きい場合に、第2重付係数Weightは、写真属性に値「0.2」が定義され、図形属性に値「1」が定義され、文字属性に値「0.2」が定義される。
重ね幅が小さい値に固定されている場合、第2重付係数Weightは、属性に関わらず一定の値「1」とされる。このため、評価値は、特徴量と属性によって定まる第1重付係数とから定められることを意味する。重ね幅が小さいライン数は、例えば、数ラインから20ラインであり、重ね幅が大きいライン数は、重ね幅が小さいライン数よりもおおきければよく、例えば、20ライン以上である。
重ね幅が大きいほど隣接する2つのバンドデータ、ここでは第1バンドデータおよび第2バンドデータに分割される領域がそれぞれのバンドデータに多く含まれる確率が高い。このため、重ね幅が大きい場合は、重ね幅が小さい場合に比較して領域の属性を高い確率で正しく判定することができる。ここでは、写真属性および文字属性の第2重付係数Weightを、重ね幅が小さい場合に値「1」を定義し、重ね幅が大きい場合に値「0.2」を定義し、重ね幅が大きいほど第2重付係数Weightを小さな値としている。
ここでは、重ね幅が大きい場合と、小さい場合とで予め定められた固定の第2重付係数としたが、第2重付係数を重ね幅と領域の幅とに応じて定まる値としてもよい。
(1)領域の幅が重ね幅よりも小さい場合、第2重付係数を「2」とする。
(2)領域の幅Ahが重ね幅Bh以上で重ね幅Bhの10倍よりも小さい場合、第2重付係数を次式に基づき定める。
Ah/Bh+1
(3)領域の幅が重ね幅の10倍を超える場合、第2重付係数を「1」とする。
重ね幅が小さいほど隣接する2つのバンドデータ、ここでは第1バンドデータおよび第2バンドデータに分割される領域がそれぞれのバンドデータに小さな領域として含まれる確率が高くなる。このため、重ね幅が小さいほど、第2重付係数を大きくする。これにより、分割される領域が小さい場合であっても、それの特徴量を評価値Eに大きく影響させることができる。このため、写真属性と判定されやすくなる。
写真属性の領域は、分割されて領域が小さくなると写真属性と判定されにくくなる。写真の領域が文字属性と誤って判定された場合には、写真の領域が2値化されてしまい、画質が大きく低下する。このため、重複領域の幅が小さい場合でも写真の領域が写真属性と判定されやすくすることで、圧縮後の画質が劣化するのを防止することができる。文字の領域が誤って写真属性と判定されても、写真領域を2値化するよりは画質の劣化が少ない。
図9は、本実施の形態におけるMFP1のCPU101で実行される画像処理の流れを示すフローチャートである。図9を参照して、まず、画像データが取得される(ステップS01)。取得された画像データは、RAM107に一時的に記憶される。
そして、画像データをバンドデータに分割する(ステップS02)。バンドデータは、隣接するバンドデータが所定の重複領域を有する。バンドデータのサイズは、予め定めておいてもよいし、2値化処理回路112で処理可能なデータ量に応じて定まるようにしても良い。分割されたバンドデータは、それを識別するために番号が付されてRAM107に記憶される。番号は、分割された順に、隣接するバンドデータで連続する番号が付される。
そして、分割されたバンドデータの総数がカウントされ(ステップS03)、変数Iに「0」が設定される(ステップS04)。変数Iは、バンドデータを特定するための変数である。ここでは、I番目のバンドデータをバンドデータ(I)で示す。
RAM107からバンドデータ(I)が読出される(ステップS05)。そして、2値化処理回路112から入力されるバンドデータ(I)に対応する文字領域データ(I)をRAM107に記憶する(ステップS06)。なお、2値化処理回路112を設けることなく、2値化処理をCPU101で実行するようにしてもよい。この場合には、CPU101は、バンドデータ(I)から文字領域を抽出し、バンドデータの文字領域に含まれる画素の値を「1」とし、他の領域に含まれる画素の値を「0」とした文字領域データ(I)を生成し、RAM107に記憶する。
次に、バンドデータ(I)から写真領域を抽出し、バンドデータの写真領域に含まれる画素の値を「1」とし、他の領域に含まれる画素の値を「0」とした写真領域データ(I)を生成し、RAM107に記憶する(ステップS07)。さらに、バンドデータ(I)から図形領域を抽出し、バンドデータの図形領域に含まれる画素の値を「1」とし、他の領域に含まれる画素の値を「0」とした図形領域データ(I)を生成し、RAM107に記憶する(ステップS08)。
ステップS09では、変数Iが0より大きいか否かが判断され、大きい場合にはステップS10に進み、そうでない場合にはステップS19に進む。ステップS19では、変数Iに1が加算されて、ステップS05に進む。変数Iが0の場合には、ステップS19に進むが、1以上の場合にはステップS10に進む。本実施の形態におけるMFP1では、2つのバンドデータの重複領域を比較するため、変数Iが「1」以上であれば、少なくとも2つのバンドデータの文字領域データ、写真領域データ、図形領域データがRAM107に記憶されている。このため、変数Iが「1」以上の場合に、2つのバンドデータの重複領域を比較するステップS10以降の処理が実行可能となる。
ステップS10では、バンドデータ(I)とそれに隣接する一つ前にRAM107に記憶されたバンドデータ(I−1)との重複領域(I)を特定する。そして、ステップS11において、バンドデータ(I)の重複領域(I)とバンドデータ(I−1)の重複領域(I)とを比較し、異なる属性と判定された画素で構成される誤判別領域を含む第1領域と第2領域がそれぞれ抽出されたか否かが判断される。抽出された場合にはステップS12へ進み、抽出されなかった場合にはステップS17に進む。異なる属性と判定された画素で構成される誤判別領域が存在しない場合には、バンドデータ(I−1)における属性判別結果とバンドデータ(I−1)における属性判別結果とが、重複領域において一致している場合である。この場合には、属性を変更する必要はない。なお、第1領域は、バンドデータ(I−1)における位置とサイズを示す情報である。第2領域は、バンドデータ(I)における位置とサイズを示す情報である。
ステップS10で抽出される第1領域および第2領域は次の領域である。
(1) バンドデータ(I−1)の誤判別領域が文字属性の場合は、文字領域データ(I−1)から誤判別領域を含む文字領域が第1領域として抽出される。文字領域は、文字領域データ(I−1)で画素値を「1」とする画素に外接する矩形の領域である。バンドデータ(I−1)の誤判別領域が写真属性の場合は、写真領域データ(I−1)から誤判別領域を含む写真領域が第1領域として抽出される。写真領域は、写真領域データ(I−1)で画素値を「1」とする画素に外接する矩形の領域である。バンドデータ(I−1)の誤判別領域が図形属性の場合は、図形領域データ(I−1)から誤判別領域を含む図形領域が第1領域として抽出される。図形領域は、図形領域データ(I−1)で画素値を「1」とする画素に外接する矩形の領域である。
(2) バンドデータ(I)の誤判別領域が文字属性の場合は、文字領域データ(I)から誤判別領域を含む文字領域が第2領域として抽出される。文字領域は、文字領域データ(I)で画素値を「1」とする画素に外接する矩形の領域である。バンドデータ(I−1)の誤判別領域が写真属性の場合は、写真領域データ(I)から誤判別領域を含む写真領域が第2領域として抽出される。写真領域は、写真領域データ(I)で画素値を「1」とする画素に外接する矩形の領域である。バンドデータ(I−1)の誤判別領域が図形属性の場合は、図形領域データ(I)から誤判別領域を含む図形領域が第2領域として抽出される。図形領域は、図形領域データ(I)で画素値を「1」とする画素に外接する矩形の領域である。
ステップS12では、第1重付係数が取得される。第1領域および第2領域それぞれに対する第1重付係数が取得される。図7に示したように、第1重付係数は、属性に応じて定められる値だからである。
次のステップS13では、第2重付係数が取得される。第1領域および第2領域それぞれに対する第2重付係数が取得される。図8に示したように、第2重付係数は、属性に応じて定められる値だからである。
そして、第1領域と第2領域の特徴量F1、F2が式(2)を用いて算出される(ステップS14)。そして、式(2)を用いて算出された評価値Eとしきい値Tとから属性が決定される(ステップS15)。
次のステップS16では、ステップS11において第1領域および第2領域の組が複数抽出された場合に、次に処理対象とするべき組があるか否かが判断される。そのような組が存在する場合にはステップS12へ戻り、存在しなくなるまでステップS12から15の処理が繰り返し実行される。
そして、バンドデータ(I−1)の第1領域とバンドデータ(I)の第2領域とのうち、ステップS15で決定された属性と異なる属性の領域の属性を、ステップS15で決定された属性に補正し、属性を統合する(ステップS17)。属性の統合は、RAM107に記憶されている合成領域データに、文字領域データ(I)、写真領域データ(I)および図形領域データ(I)を追加することにより行なわれる。変数Iが「1」の場合は、合成領域データがRAM107に記憶されていない。この場合には、文字領域データ(I−1)、写真領域データ(I−1)、図形領域データ(I−1)、文字領域データ(I)、写真領域データ(I)および図形領域データ(I)を統合した合成領域データが生成されて、RAM107に記憶される。合成領域データは、たとえば、文字領域に含まれる画素の値を「1」とし、写真領域に含まれる画素の値を「2」とし、図形領域に含まれる画素の値を「3」としたデータである。
次のステップS18では、変数Iが分割数N(バンドデータ数)より小さいか否かが判断され、真の場合にはステップS19へ進み、偽の場合にはステップS20に進む。
ステップS20では圧縮処理が実行される。
図10は、図9のステップS20で実行される圧縮処理の流れを示すフローチャートである。圧縮処理では、まず、合成領域データから領域を抽出する(ステップS21)。ここで抽出する領域は、文字属性、写真属性および図形属性の領域である。合成領域データが複数の領域を含む場合には、いずれか1つが抽出される。抽出する順は任意である。上述したように、圧縮処理は、属性に応じた圧縮方式が選択される。このため、抽出された領域の属性に応じた圧縮方式により定まる圧縮パラメータが取得される(ステップS22)。圧縮パラメータは、ROM105に予め記憶されている。また、フラッシュROM126から読み出すようにしてもよいし、操作パネル122からユーザが入力するようにしてもよい。
そして、画像データのうちステップS21で抽出された領域が、その領域の属性に対応する圧縮方式で圧縮処理される(ステップS23)。圧縮する際に必要とされる圧縮パラメータは、ステップS22で取得された圧縮パラメータが用いられる。これにより、画像データのうちステップS21で抽出された領域ごとに圧縮した圧縮データが生成される。
そして、次に圧縮処理の対象とするべき領域が合成領域データに存在するか否かが判断され(ステップS24)、存在する場合にはステップS21に戻り、存在しない場合にはステップS25に進む。
ステップS25では、領域ごとに圧縮された圧縮データを、1つの圧縮データにまとめたファイルを生成する。生成されるファイルは、領域ごとに圧縮されたデータの圧縮方式と画像データ中の位置情報とを含む。
そして、圧縮データが出力される(ステップS26)。出力は、ハードディスクユニット119へ記憶する処理であってもよいし、ネットワークIF123よりネットワークを介して他のコンピュータに送信する処理であってもよい。
なお、本実施の形態におけるMFP1では、判別する属性を、文字、写真、図形としたが、これに限らず別の属性を判別するようにしてもよい。
以上説明したように本実施の形態におけるMFP1は、隣接する2つのバンドデータを互いに共通する重複領域を有するように画像データを分割して属性領域を抽出するので、少ないメモリ容量で処理することができる。また、重複領域で重複している属性領域が、2つのバンドデータで異なる属性として判別されたことを検出することができる。
また、重複領域に2つのバンドデータで異なる属性として判別された誤判別領域がある場合、誤判別領域を含む第1領域および第2領域それぞれの特徴量に基づき、第1の領域の属性と第2の領域の属性とのいずれか1つに決定するので、第1領域および第2領域の属性を同じにすることができる。
なお、本実施の形態では、MFP1について説明したが、図9および図10に示した処理をコンピュータに実行させるための画像処理方法または画像処理プログラムとして発明を捉えることができるのは言うまでもない。
今回開示された実施の形態はすべての点で例示であって制限的なものではないと考えられるべきである。本発明の範囲は上記した説明ではなくて特許請求の範囲によって示され、特許請求の範囲と均等の意味および範囲内でのすべての変更が含まれることが意図される。
本発明の実施の形態の1つにおけるMFPの概略構成を示す模式的断面図である。 本実施の形態におけるMFPの回路構成を示すブロック図である。 本実施の形態におけるCPUの機能を示す機能ブロック図である。 バンドデータの一例を示す図である。 合成領域データ生成部の詳細な構成を示すブロック図である。 バンドデータを示す別の図である。 第1重付係数テーブルの一例を示す図である。 第2重付係数テーブルの一例を示す図である。 本実施の形態におけるMFPのCPUで実行される画像処理の流れを示すフローチャートである。 図9のステップS20で実行される圧縮処理の流れを示すフローチャートである。
符号の説明
1 MFP、112 2値化処理回路、122 操作パネル、151 画像分割部、153 領域判別部、154 領域抽出部、155 合成領域データ生成部、157 圧縮部、159 文字データ合成部、161 誤判別判定部、163 第1特徴量算出部、165 第2特徴量算出部、167 属性決定部、169A,169B 補正部、171 合成部。

Claims (8)

  1. 画像データを隣接するバンドデータが互いに重なる重複領域を有する複数のバンドデータに分割する分割手段と、
    前記複数のバンドデータそれぞれから複数種類の属性別に領域を抽出する領域判別手段と、
    前記複数のバンドデータは、前記重複領域を有する第1バンドデータおよび第2バンドデータとを含み、前記第1バンドデータから抽出された前記領域のうちから第1領域を抽出し、前記第2バンドデータから抽出された前記領域のうちから第2領域を抽出する領域抽出手段と、
    前記第1領域と前記第2領域とは、前記重複領域で少なくとも一部が重複し、かつ、互いに属性が異なり、
    抽出された前記第1領域の特徴量を算出する第1特徴量算出手段と、
    抽出された前記第2領域の特徴量を算出する第2特徴量算出手段と、
    前記第1領域の特徴量と前記第2領域の特徴量とに基づき、前記第1領域の属性と前記第2領域の属性とのいずれか1つに決定する属性決定手段と、
    前記第1領域の属性と前記第2領域の属性のうち前記決定された属性と異なる属性を前記決定された属性に変更する補正手段とを備えた、画像処理装置。
  2. 前記第1特徴量算出手段は、前記画像データの前記第1領域に含まれる画素の画素値に基づいてヒストグラムを生成する第1生成手段を含み、生成された前記ヒストグラムのピーク値の数に基づいて前記第1特徴量を算出し、
    前記第2特徴量算出手段は、前記画像データの前記第2領域に含まれる画素の画素値に基づいてヒストグラムを生成する第2生成手段を含み、生成された前記ヒストグラムのピーク値の数に基づいて前記第2特徴量を算出する、請求項1に記載の画像処理装置。
  3. 前記属性決定手段は、前記第1領域の特徴量と前記第2領域の特徴量それぞれに、属性に応じて予め定められた第1重付係数を乗じた値を比較する比較手段を含む、請求項1に記載の画像処理装置。
  4. 前記比較手段は、前記第1領域の特徴量と前記第2領域の特徴量それぞれに、属性ごとに前記重複領域の幅に応じて予め定められた第2重付係数をさらに乗じた値を比較する、請求項3に記載の画像処理装置。
  5. 前記属性決定手段は、前記第1領域と該第1領域が前記重複領域に含まれる領域との比率に応じて第3重付係数を決定する第3重付係数決定手段と、
    前記第2領域と該第2領域が前記重複領域に含まれる領域との比率に応じて第4重付係数を決定する第4重付係数決定手段とをさらに含み、
    前記比較手段は、前記第1領域の特徴量に、前記第3重付係数をさらに乗じた値と、前記2領域の特徴量に前記第4重付係数をさらに乗じた値とを比較する、請求項3に記載の画像処理装置。
  6. 前記属性別に抽出された領域が入力され、入力された前記領域のうち前記重複領域で重複し、属性が同じ2つの領域を統合する統合手段と、
    前記統合手段により統合された領域および前記統合手段により統合されなかった領域ごとに、属性に対応して予め定められた圧縮方式で前記画像データを圧縮符号化する圧縮手段をさらに備えた、請求項1に記載の画像処理装置。
  7. 画像データを隣接するバンドデータが互いに重なる重複領域を有する複数のバンドデータに分割するステップと、
    前記複数のバンドデータそれぞれから複数種類の属性別に領域を抽出するステップと、
    前記複数のバンドデータは、前記重複領域を有する第1バンドデータおよび第2バンドデータとを含み、前記第1バンドデータから抽出された前記領域のうちから第1領域を抽出し、前記第2バンドデータから抽出された前記領域のうちから第2領域を抽出するステップと、
    前記第1領域と前記第2領域とは、前記重複領域で少なくとも一部が重複し、かつ、互いに属性が異なり、
    抽出された前記第1領域の特徴量を算出するステップと、
    抽出された前記第2領域の特徴量を算出するステップと、
    前記第1領域の特徴量と前記第2領域の特徴量とに基づき、前記第1領域の属性と前記第2領域の属性とのいずれか1つに決定するステップと、
    前記第1領域の属性と前記第2領域の属性のうち前記決定された属性と異なる属性を前記決定された属性に変更するステップとを含む、画像処理方法。
  8. 画像データを隣接するバンドデータが互いに重なる重複領域を有する複数のバンドデータに分割するステップと、
    前記複数のバンドデータそれぞれから複数種類の属性別に領域を抽出する領域判別手段と、
    前記複数のバンドデータは、前記重複領域を有する第1バンドデータおよび第2バンドデータとを含み、前記第1バンドデータから抽出された前記領域のうちから第1領域を抽出し、前記第2バンドデータから抽出された前記領域のうちから第2領域を抽出するステップと、
    前記第1領域と前記第2領域とは、前記重複領域で少なくとも一部が重複し、かつ、互いに属性が異なり、
    抽出された前記第1領域の特徴量を算出するステップと、
    抽出された前記第2領域の特徴量を算出するステップと、
    前記第1領域の特徴量と前記第2領域の特徴量とに基づき、前記第1領域の属性と前記第2領域の属性とのいずれか1つに決定するステップと、
    前記第1領域の属性と前記第2領域の属性のうち前記決定された属性と異なる属性を前記決定された属性に変更するステップとをコンピュータに実行させる、画像処理プログラム。
JP2004369070A 2004-12-21 2004-12-21 画像処理装置、画像処理方法および画像処理プログラム Expired - Fee Related JP4483567B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2004369070A JP4483567B2 (ja) 2004-12-21 2004-12-21 画像処理装置、画像処理方法および画像処理プログラム
US11/305,559 US7529419B2 (en) 2004-12-21 2005-12-16 Data processing device capable of processing image data with small memory capacity, image processing method, and program product

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004369070A JP4483567B2 (ja) 2004-12-21 2004-12-21 画像処理装置、画像処理方法および画像処理プログラム

Publications (2)

Publication Number Publication Date
JP2006180030A true JP2006180030A (ja) 2006-07-06
JP4483567B2 JP4483567B2 (ja) 2010-06-16

Family

ID=36595819

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004369070A Expired - Fee Related JP4483567B2 (ja) 2004-12-21 2004-12-21 画像処理装置、画像処理方法および画像処理プログラム

Country Status (2)

Country Link
US (1) US7529419B2 (ja)
JP (1) JP4483567B2 (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010232795A (ja) * 2009-03-26 2010-10-14 Seiko Epson Corp 階調数低減装置、階調数低減方法
JP2013031106A (ja) * 2011-07-29 2013-02-07 Brother Ind Ltd 画像処理装置、および、コンピュータプラグラム
JP2013031105A (ja) * 2011-07-29 2013-02-07 Brother Ind Ltd 画像処理装置、画像処理プラグラム
JP2013031104A (ja) * 2011-07-29 2013-02-07 Brother Ind Ltd 画像処理装置およびプログラム
JP2020010163A (ja) * 2018-07-06 2020-01-16 シャープ株式会社 画像処理装置、画像処理方法、コンピュータプログラム及び記録媒体

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7446914B2 (en) * 2005-03-16 2008-11-04 Kabushiki Kaisha Toshiba Image processing apparatus
JP4345757B2 (ja) * 2006-02-22 2009-10-14 セイコーエプソン株式会社 画像データの色の補正
JP2008160404A (ja) * 2006-12-22 2008-07-10 Ricoh Co Ltd 画像処理装置、画像処理方法、コンピュータプログラム、及び、情報記憶媒体
US8107743B2 (en) * 2007-03-30 2012-01-31 Sharp Kabushiki Kaisha Image processing device, image processing method, and storage medium
JP2010131855A (ja) * 2008-12-04 2010-06-17 Seiko Epson Corp 画像処理装置、画像処理方法、および画像形成装置
JP5865337B2 (ja) * 2013-11-18 2016-02-17 キヤノン株式会社 画像処理装置及びその制御方法、プログラム

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05135202A (ja) 1991-11-11 1993-06-01 Fuji Facom Corp 文書画像読み取り装置
US5991515A (en) * 1992-11-10 1999-11-23 Adobe Systems Incorporated Method and apparatus for compressing and decompressing data prior to display
US6151420A (en) * 1995-12-15 2000-11-21 Polaroid Corporation Minimizing blocking artifacts in a filtered image
JP2000022943A (ja) * 1998-06-30 2000-01-21 Minolta Co Ltd 画像領域判別装置および方法ならびに画像領域判別プログラムを記録した記録媒体
WO2001028405A2 (en) * 1999-10-20 2001-04-26 The Trustees Of The University Of Pennsylvania Enhancement of images for ophthalmic disgnosis
US6331860B1 (en) * 1999-11-24 2001-12-18 Xerox Corporation Method and apparatus for stitching scanned image segments together to form an oversized document
US6983081B2 (en) * 2002-08-23 2006-01-03 Ulead Systems, Inc. Method for integration of source object into base image
US7260258B2 (en) * 2003-06-12 2007-08-21 Fuji Xerox Co., Ltd. Methods for multisource color normalization
JP2005141527A (ja) * 2003-11-07 2005-06-02 Sony Corp 画像処理装置、および画像処理方法、並びにコンピュータ・プログラム
US7293712B2 (en) * 2004-10-05 2007-11-13 Hand Held Products, Inc. System and method to automatically discriminate between a signature and a dataform

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010232795A (ja) * 2009-03-26 2010-10-14 Seiko Epson Corp 階調数低減装置、階調数低減方法
JP2013031106A (ja) * 2011-07-29 2013-02-07 Brother Ind Ltd 画像処理装置、および、コンピュータプラグラム
JP2013031105A (ja) * 2011-07-29 2013-02-07 Brother Ind Ltd 画像処理装置、画像処理プラグラム
JP2013031104A (ja) * 2011-07-29 2013-02-07 Brother Ind Ltd 画像処理装置およびプログラム
JP2020010163A (ja) * 2018-07-06 2020-01-16 シャープ株式会社 画像処理装置、画像処理方法、コンピュータプログラム及び記録媒体
JP7050599B2 (ja) 2018-07-06 2022-04-08 シャープ株式会社 画像処理装置及び画像処理方法

Also Published As

Publication number Publication date
JP4483567B2 (ja) 2010-06-16
US7529419B2 (en) 2009-05-05
US20060133679A1 (en) 2006-06-22

Similar Documents

Publication Publication Date Title
US7529419B2 (en) Data processing device capable of processing image data with small memory capacity, image processing method, and program product
JP4808267B2 (ja) 画像処理装置、画像形成装置、画像処理方法、コンピュータプログラム及び記録媒体
JP4604100B2 (ja) 画像処理方法、画像処理装置、画像形成装置、プログラムおよび記憶媒体
US7321688B2 (en) Image processor for character recognition
US20080031549A1 (en) Image processing apparatus, image reading apparatus, image forming apparatus, image processing method, and recording medium
US8274707B2 (en) Image processing apparatus, image processing method, and program for determining or computing an extended region of a block region of image data or an input image
US9667833B2 (en) History generating apparatus and history generating method
JPH0844827A (ja) デジタル複写機
JP2008271488A (ja) 画像処理方法、画像処理装置、画像形成装置、画像読取装置、コンピュータプログラム、及び記録媒体
US8411318B2 (en) Color and monochrome image processing and outputting apparatus
JP4345648B2 (ja) 写真画像処理方法及びその装置
JP4213112B2 (ja) 画像検索装置、画像形成装置、画像検索装置の制御方法、画像検索プログラムおよびコンピュータ読取り可能な記録媒体
JP2008236169A (ja) 画像処理装置、画像処理方法及び画像処理プログラム
US6972865B1 (en) Image processing apparatus and method, and storage medium
JP3873947B2 (ja) 画像処理装置および画像処理プログラム
JPH08214161A (ja) 画像処理装置
JP2003338930A (ja) 画像処理方法、画像処理装置、並びに画像形成装置
JP2003219187A (ja) 画像処理方法及び画像処理装置
JP4720633B2 (ja) 画像処理システムおよび画像処理プログラム
JP2006268767A (ja) 画像処理装置及び定型文書記入データ処理システム
JP4483563B2 (ja) 画像処理装置、画像処理方法および画像処理プログラム
JP2005316583A (ja) 画像処理方法、画像処理装置及び画像処理プログラム
JP4140482B2 (ja) 画像処理装置
JP6618307B2 (ja) 画像処理装置、画像形成装置、及び、解像度決定方法
JP2003179737A (ja) 画像処理装置、画像形成装置、および画像処理方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20071017

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20090316

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20091124

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100119

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20100302

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100315

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130402

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140402

Year of fee payment: 4

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees