JP2010056690A - 画像処理装置及び画像処理方法 - Google Patents

画像処理装置及び画像処理方法 Download PDF

Info

Publication number
JP2010056690A
JP2010056690A JP2008217321A JP2008217321A JP2010056690A JP 2010056690 A JP2010056690 A JP 2010056690A JP 2008217321 A JP2008217321 A JP 2008217321A JP 2008217321 A JP2008217321 A JP 2008217321A JP 2010056690 A JP2010056690 A JP 2010056690A
Authority
JP
Japan
Prior art keywords
color
region
area
pixel
target color
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2008217321A
Other languages
English (en)
Other versions
JP2010056690A5 (ja
JP5049921B2 (ja
Inventor
Yuuki Matsumoto
友希 松本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2008217321A priority Critical patent/JP5049921B2/ja
Priority to US12/547,292 priority patent/US8774511B2/en
Publication of JP2010056690A publication Critical patent/JP2010056690A/ja
Publication of JP2010056690A5 publication Critical patent/JP2010056690A5/ja
Application granted granted Critical
Publication of JP5049921B2 publication Critical patent/JP5049921B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T11/002D [Two Dimensional] image generation
    • G06T11/001Texturing; Colouring; Generation of texture or colour

Landscapes

  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Facsimile Image Signal Circuits (AREA)
  • Image Processing (AREA)
  • Color Image Communication Systems (AREA)

Abstract

【課題】画像データを精度良く分割することにより、分割誤りによる画質の劣化を抑制すること。
【解決手段】画像データを入力する入力部201と、入力部201で入力した画像データの各画素毎に、属性情報を生成する属性情報生成部203と、入力部201で入力した画像データを、予め定められたサイズの複数のブロックに分割するブロック分割部211と、ブロック分割部211で分割した着目ブロック内に出現する色と画素数のヒストグラムを生成するヒストグラム生成部212と、予め定められた条件に基づいて、着目色の領域が有意な領域として決定し、着目色の領域が有意な領域として決定されなかった場合、着目色の領域の色を、着目色の領域が接する他の色の領域における色と同じ色とするため、着目色の領域内の画素の色を他の色に置換する色置換部213と、を備える。
【選択図】図2

Description

本発明は、画像データから文字や写真等の各要素を抽出する画像処理技術に関する。
画像データから文字や写真等の各要素を抽出する技術として、例えば、特許文献1には、入力画像を複数のブロックに分割し、ブロック単位で色置換を行う技術が開示されている。
国際公開WO2006/066325号公報
ここで、画像を複数のブロックに分割した場合、本来同一の領域であるべき部分が分割後にブロックの境界によって分断されて微小な領域になる場合がある。
しかしながら、特許文献1で開示されている技術では、このような微小領域をノイズと誤判定して除去してしまったり、本来同一の領域であるべき領域を分割してしまったりする。このため、分割精度が悪く、画質の劣化を招いていた。
従って、本発明の目的は、画像データを精度良く分割することにより、分割誤りによる画質の劣化を抑制することにある。
上記課題を解決するため、本発明の画像処理装置は、画像データを入力する入力手段と、前記入力手段で入力した画像データの各画素毎に、属性情報を生成する属性情報生成手段と、前記入力手段で入力した画像データを、予め定められたサイズの複数のブロックに分割する分割手段と、前記分割手段で分割した着目ブロック内に出現する色と画素数のヒストグラムを生成する生成手段と、前記生成手段で生成したヒストグラムで得られた着目色を持つ領域の面積が予め定められた閾値よりも大きい場合、着目色の領域を有意な領域として決定する第1の決定手段と、前記生成手段で生成したヒストグラムで得られた着目色を持つ領域の面積が予め定められた閾値以下の場合であって、着目色の領域が着目ブロックの境界に位置し、且つ、前記着目色の領域内の前記境界の画素に対する、前記属性情報生成手段で生成された属性情報が、予め定められた属性を示す場合、前記着目色の領域が有意な領域として決定する第2の決定手段と、前記第1、第2の決定手段のいずれでも、前記着目色の領域が有意な領域として決定されなかった場合、前記着目色の領域の色を、当該着目色の領域が接する他の色の領域における色と同じ色とするため、前記着目色の領域内の画素の色を前記他の色に置換する置換手段と、を備える。
また、本発明の画像処理方法は、画像データを入力する入力工程と、前記入力工程で入力した画像データの各画素毎に、属性情報を生成する属性情報生成工程と、前記入力工程で入力した画像データを、予め定められたサイズの複数のブロックに分割する分割工程と、前記分割工程で分割した着目ブロック内に出現する色と画素数のヒストグラムを生成する生成工程と、前記生成工程で生成したヒストグラムで得られた着目色を持つ領域の面積が予め定められた閾値よりも大きい場合、着目色の領域を有意な領域として決定する第1の決定工程と、前記生成工程で生成したヒストグラムで得られた着目色を持つ領域の面積が予め定められた閾値以下の場合であって、着目色の領域が着目ブロックの境界に位置し、且つ、前記着目色の領域内の前記境界の画素に対する、前記属性情報生成工程で生成された属性情報が、予め定められた属性を示す場合、前記着目色の領域が有意な領域として決定する第2の決定工程と、前記第1、第2の決定工程のいずれでも、前記着目色の領域が有意な領域として決定されなかった場合、前記着目色の領域の色を、当該着目色の領域が接する他の色の領域における色と同じ色とするため、前記着目色の領域内の画素の色を前記他の色に置換する置換工程と、を有する。
本発明によれば、画像データを精度良く分割することにより、分割誤りによる画質の劣化を抑制することができる。
以下に、本発明の実施の形態について添付図面を参照して詳細に説明する。なお、以下に説明する実施の形態は、本発明の実現手段としての一例であり、本発明は、その趣旨を逸脱しない範囲で以下の実施形態を修正又は変形したものに適用可能である。
<第1の実施形態>
図1は、本発明の第1の実施形態に係るシステムの機能的構成を示すブロック図である。100は本発明を実現するための画像処理装置である。画像処理装置100は、読み取った文書の紙面情報を画像データに変換するスキャナ101と、画像データに本発明の処理を施すためのプログラムを実行するCPU102とを有する。また、画像処理装置100は、プログラムを実行する際のワークメモリやデータの一時保存等に利用されるメモリ103と、プログラムやデータを格納するハードディスク104と、外部装置とデータの入出力を行うためのネットワークI/F105とを有する。パーソナルコンピュータ(以下、PCと言う。)120は、画像処理装置100とLAN110等のネットワークで接続され、画像処理装置100から送信されたデータを受信する。
図2は、第1の実施形態に係る画像処理装置100の機能的構成を示すブロック図である。なお、ここで示す各処理は、CPU102で電子ドキュメント生成プログラムを実行することによって実現されるものとするが、その一部又は全部を電気回路で構成するようにしても構わない。
201はスキャナ101により文書を入力する入力部である。202は文書を電子化して画像を生成するスキャン画像処理部である。203は画素毎に属性データを生成する画素毎の属性情報生成部である。
画素毎の属性データとは、原稿画像に含まれる画像の特徴に応じて最適な画像処理を施すために原稿画像の特徴を抽出して像域属性を画素毎に示す信号(以下、フラグデータ)を言う。例えば、イメージスキャナ等によって読み取られた画像には、原稿画像中に連続階調のフルカラーの写真領域や、黒一色の文字領域又は新聞印刷のような網点印刷領域等のように、種々の画像領域が混在している。
これらを一律に同一の画像処理手順で処理して出力すると、その出力画像は一般に好ましい画質が得られない場合が多い。そこで、入力部201から入力されるカラー画像データを用いて原画像中に含まれる画像データの属性を検出し、この画像データの属性を識別するためのフラグデータを生成する。
なお、具体的な手順は、特開2004−350240に開示された技術を用いることができる。例えば、文字属性については以下のように行う。すなわち、画像データをラスタースキャン順に順次着目し、着目画素近傍の一定範囲の画素(例えば、7×7画素領域)についてラプラシアンフィルタを用いたフィルタ処理を行い、着目画素値が閾値よりも大きい場合には、その画素はエッジを構成すると判定される。文字検出用である場合には、文字は主として線から構成されるため、一定方向について比較的低周波に対応したフィルタを用いることにより、文字領域を効率的に検出することができる。
そして、着目画素近傍の一定領域内に、文字のエッジであると判定された画素が一定数以上含まれている場合には、着目画素は文字領域として対応する文字フラグがセットされる。当然のことではあるが、文字属性以外にも網点属性や図形属性等のように、画像処理に応じてあらゆる属性データが生成される。
なお、イメージスキャナの属性データだけでなく、ページ記述言語からPDLコマンドを解釈してプリント画像を生成する際に、このときのコマンドの種別を示す情報を参照してもよい。この場合には、文字領域を構成する画素を識別するためのフラグデータを画素毎に検出することとなる。
いずれにしても、文字属性であると判定された画素を「1」とし、それ以外の画素を「0」として、1ビットを出力する信号である。
図3において、(a)は入力された画像データを示す図であり、(b)は図3(a)で入力された画像データから生成された属性データを示す図である。また、図4において、(a)は図3(b)で生成した属性データをフラグデータで示す図であり、(b)は図4(a)で示すフラグデータの変形例を示す図である。
例えば、図3(a)に示す画像データが入力された場合には、画像データと同時に、図3(b)に示す画素毎の属性データが生成される。ここで生成された属性データは、図4(a)で示すように、黒い部分が「0」、白い部分が「1」を示す情報である。
なお、画素毎の属性データは、本実施形態では、文字領域全体を示す情報としたが、図4(b)で示すように、文字のエッジ部分のみを示す情報であっても構わない。
210はカラー画像を色置換し、類似する色領域に分割する類似色領域統合部である。入力される画像には、スキャンノイズやモスキートノイズが付加され、本来同一の色であった領域が微妙に色味が変化する場合がある。この処理では領域の色情報の統計を取得し、類似色の色置換を行う。
類似色領域統合部210は、ブロック分割部211と、ヒストグラム生成部212と、色置換部213と、ブロック統合部214とを有する。
ブロック分割部211は、入力部201で入力した画像データを、予め定められたサイズの複数のブロックに分割する。ヒストグラム生成部212は、ブロック分割部211で分割した着目ブロック内に出現する色と画素数のヒストグラムを生成する。色置換部213は、後述する所定の条件に基づいて、着目色の領域を、着目色の領域が接する他の色の領域に統合するため、着目色の領域内の画素の色を他の色に置換する。ブロック統合部214は、後述する所定の条件を満たした場合には、着目領域と着目領域が接するブロック内の領域とを統合する。なお、色置換部213は、本実施形態では、後述するように、着目色の領域が有意な領域として決定する第1の決定手段及び第2の決定手段としても機能する。
図5において、(a)は類似色領域統合部210に入力された画像500を示す図であり、(b)はブロック分割部211で画像500を分割した状態を示す図である。また、図6において、(a)は図5(b)で示すブロック501の色情報の分布を模式的に示す図であり、(b)は図5(b)で示すブロック504の色情報の分布を模式的に示す図である。
ブロックの縦横のサイズは定数とし、本実施形態では、図5(b)で示すように、6つのブロック501、502、503、504、505、506に分割する。また、ヒストグラム生成部212では、ブロック内の色情報を公知の技術を用いて抽出する。ヒストグラム生成部212は、本実施形態では、色情報とその分布を抽出する。
色置換部213では、ブロック内の画素を先に求めた色情報で色置換する。ここで、色置換部213の動作手順について、図7を用いて説明する。
図7は、色置換部213の動作手順を示す図である。また、図8において、(a)はブロック501を示す図であり、(b)はブロック501のフラグデータの一例を示す図であり、(c)は色置換後の画素領域800を示す図であり、(d)は色置換後の画像500を示す図である。
まず、ステップS701では、ヒストグラム生成部212で生成したヒストグラムで得られた着目色を持つ着目領域の面積を算出する。すなわち、前述した分布に基づいて、色情報が類似する領域をグループ化して画素数を算出する。
次に、ステップS702では、着目領域の面積が予め定められた閾値Th1以下であるか否かを判定する。ステップS702で着目領域の面積が閾値Th1よりも大きいと判定された場合には、ステップS705に進み、着目色の領域を有意な領域として決定し、色置換処理を行わずにその領域単独の領域とする。
例えば、図5で示すブロック501の場合、領域vの面積は閾値Th1よりも大きいため、ステップS705に進み、領域w及び領域xの面積は閾値Th1以下であるため、ステップS703へ進む。また、ブロック504の場合、領域y及び領域zの面積はいずれも閾値Th1よりも大きいため、ステップS705に進む。
ここで、ある程度小さな領域は、ノイズとみなして他の領域の色に置換する処理が一般的である。しかし、ブロック内での面積は小さくても、ブロックの境界で分断された領域であり、ノイズではない可能性がある。よって、本実施形態では、ステップS703以降の処理を追加する。
ステップS703では、着目領域が、着目ブロックと隣接ブロックとの境界線と接する画素を有するか否かを判定する。なお、境界線と接する画素だけでなく、境界線から一定範囲の画素分内側の領域と定義してもよい。ステップS703で境界線と接する画素を有すると判定された場合にはステップS704に進み、ステップS703で境界線と接する画素を有しないと判定された場合にはステップS706へ進む。
ここで、図8(a)で示す画素領域800は、本実施形態では、着目するブロック501の端とみなす画素領域である。ステップS703に進んだブロック501の領域wと領域xのうち、領域wは画素領域800に含まれないため、ステップS706へ進み、領域xは画素領域800に含まれるため、ステップS704へ進む。
ステップS704では、画素毎の属性情報生成部203で生成したフラグデータを参照して、境界線と接する位置にフラグデータが連続して存在するか否かを判定する。ステップS704でフラグデータが連続して存在すると判定された場合には、ステップS705へ進み、ステップS704でフラグデータが連続して存在しないと判定された場合には、ステップS706へ進む。ここでは、単にフラグの有無を判定するだけでなく連続性を加味することにより、ノイズと誤認識することを抑制している。
図8(b)で示すように、ブロック501の領域xに該当する位置にフラグが連続して「1」となっている。よって、ステップS705の単独領域として扱う処理へ進む。
このようにして、画素領域800を色置換すると、図8(c)で示すような状態となる。ここで、スキャンノイズとみなされた領域wは隣接する領域の色に置換され、分割前には大きな領域であったが、ブロック分割により小さな領域になった領域xは単独の領域として色置換処理を行うことなく残存する。そして、ステップS707で色置換後に残存する領域を出力する。
その結果、画像500は、図8(d)に示す状態となる。その後、ブロック統合部214でブロック単位で色置換した領域を隣接するブロックの類似色領域と統合する。ここで、ブロック統合部214の詳細な動作手順について、図9を用いて説明する。
図9は、第1の実施形態に係るブロック統合部214の動作手順を示す図である。また、図10において、(a)は着目ブロックと隣接ブロックの色置換後に残存する領域の一例を示す図であり、(b)は色置換後に残存する領域の色情報を模式的な色空間上に示したグラフを示す図である。また、図11において、(a)は着目ブロックと隣接ブロックの色置換後に残存する領域の一例を示す図であり、(b)は図11(a)で示す領域のフラグデータの一例を示す図である。
まず、ステップS901では、色置換部213から出力された着目する領域Aを取得する。すなわち、領域Aは、第1、第2の決定手段のいずれかで有意な領域として決定された領域である。ステップS902では、領域Aを含む着目ブロックに隣接する他のブロックで有意と決定された領域B[num]を取得する。
なお、隣接ブロックは、本実施形態では、処理対象となる着目ブロックの上側及び左側に接するブロックとする。例えば、処理対象となるブロックが図5(b)で示すブロック505である場合には、隣接ブロックは、ブロック502、504となる。
ステップS903は、先に取得した隣接ブロックのすべての領域に対して、ステップS904以降の処理を実行させるループ処理指令である。
ステップS904では、領域Aと領域Bの色情報の色差を求める。なお、色差の求め方は、公知の技術を用いることとし、本実施形態では、一般的な色空間上における互いの色情報の距離を求めることとする。
ステップS905では、領域Aと領域B[xs]の色情報が類似するか否かを判定する。例えば、ステップS904で求めた色差が予め定められた閾値以下であるか否かを判定する。ステップS905で色情報が類似すると判定された場合には、ステップS909の統合処理へ進み、ステップS905で色情報が類似しないと判定された場合には、ステップS906の処理へ進む。
ここで、例えば、図10(b)で示すように、ブロック502の領域aとブロック505の領域eは、色情報の明度が近似しており、色差がほとんどない。このため、図10(a)で示すように、領域aと領域eは、色情報が類似するとみなして統合処理へ進むこととなる。一方、ブロック502の領域bとブロック505の領域cは、色情報の明度が近似していないため、色情報が類似するとはみなされずにステップS906の処理へ進む。
ステップS906では、着目する領域が、着目ブロックと隣接するブロックとの境界線と接する画素を有するか否かを判定する。ステップS906で境界線と接する画素を有すると判定された場合には、ステップS907に進み、ステップS906で境界線と接する画素を有しないと判定された場合には、ステップS910へ進む。
例えば、図11(a)で示すように、領域bは、着目するブロック502と着目ブロックに隣接するブロック505との境界線1100と接する画素を有する。よって、ステップS907へ進む。
ステップS907では、画素毎の属性情報生成部203で領域B[x]に生成したフラグデータを参照し、境界線と接する位置にフラグデータが連続して存在しているか否かを判定する。
ステップS907でフラグデータが連続して存在していると判定された場合には、ステップS908へ進み、ステップS907でフラグデータが連続して存在していないと判定された場合には、ステップS910へ進む。ここでは、単にフラグの有無を判定するだけではなく、連続性を加味することでノイズとの切り分けを行う。
図11(b)は、境界線1100と接する位置に存在するフラグデータの一例を示している。領域bの付近にフラグデータが連続して「1」となっている。よって、ステップS908へ進む。
ここまでの処理だけでは、領域B[x]はいずれかの領域の一部分であるが、ブロック分割処理によって小さな領域になり、色置換処理でブロック内に支配的に存在する色情報により色置換結果に影響が出てしまう可能性がある。よって、ステップS908では、閾値Th1を、閾値Th1とは異なる閾値Th2に変更し、類似色の判定を行う。
すなわち、ステップS908では、再度、領域A及び領域B[x]の色情報が類似するか否かを判定する。
閾値Th2は、例えば図10(a)で示すブロック502の領域bの場合、図10(b)で示すグラフにおいて、着目するブロック内で最大の面積を有する領域aの色情報の明度に関する距離(色差)を閾値Th1に領域aとは反対の向きへ重み付けして算出する。
ステップS908で色情報が類似すると判定された場合には、ステップS909へ進み、統合処理を行う。一方、ステップS908で色情報が類似しないと判定された場合には、ステップS910へ進み、統合処理を行わないこととする。
図12は、ブロック統合後の画像500の状態を示す図である。図12で示す文字は、図8(b)で示す文字と比べて、ブロックの境界で分割され、色置換された結果が異なる領域が統合されたことがわかる。その後の画像解析部220には、図12で示す文字情報が入力される。
220は画像解析部である。画像解析部220は、領域分割部221と、文字変換部223と、写真変換部225と、線画変換部227と、表変換部229と、それらの変換結果を1つにまとめる合成部2210とを有する。
領域分割部221は、公知の領域分割技術を用いて、文字、写真、線画、表に分割する。領域分割技術の具体例としては、米国特許5680478号公報(特許文献2)に記載の処理等を用いることができる。
特許文献2では、文書画像中の黒画素塊、白画素塊の集合を抽出し、その形状、大きさ、集合状態等に基づいて、文字、絵、図、表、枠、線等の特徴的な領域を抽出する技術が開示されている。また、特許文献2以外にも、領域分割に用いる特徴量を入力多値画像から近似色画素塊を抽出する技術、多値画像を二値化して得た黒画素塊に基づいて抽出する技術、又は多値画像から微分エッジ情報等を生成してエッジ内の画素として抽出する技術等がある。本実施形態では、これらのいずれかの技術を用いることとする。
領域分割部221で、文字、写真、線画、表に分割された各領域は、それぞれの分類毎の変換処理を行う。例えば、文字変換部223では、公知の文字認識技術を用いて各文字領域内の文字認識を行い、文字コードデータを生成する。
次に、文字認識技術の具体例について説明する。まず、文字領域の行方向(すなわち、縦書きであるか、横書きであるか)を判断する。これは、例えば、画像を二値化し、縦横の射影を取得して射影分散の低い方を行方向と判定することができる。
次に、画像をそれぞれの文字画像に分割する。これは、二値画像の行方向への射影を用いて切断すべき行間を検出することで行画像に分割し、さらに、行画像を行と垂直方向への射影を用いて切断すべき文字間を検出することで文字画像に分割すればよい。
そして、それぞれの文字画像に対して特徴を取り、予め全字種分の特徴を保存した辞書から一番特徴が近似するものを検索し、辞書が示す文字コードを各文字の認識結果とする。また、写真変換部225では、公知の高解像度変換処理を用いて、高画質ラスタデータを生成する。
線画変換部227では、公知のベクトル化技術を用いて、線画の画像データから線画のベクトル描画データを生成する。ベクトル化技術の具体例としては、特許第3026592号(特許文献3)や特開2005−346137号公報(特許文献4)記載の処理等がある。
特許文献3では、画像をラスタ走査しながら注目画素とその近傍画素の状態に基づいて、水平方向及び垂直方向の画素間ベクトルを検出する。次に、これら画素間ベクトル同士の接続状態に基づいて、画像データの輪郭を抽出することにより、アウトラインベクトルと呼ばれる連結画素データの周回を画素間ベクトルの集合で記述する情報を生成する技術が開示されている。また、特許文献4では、アウトラインベクトルを直線や2次又は3次のベジェ曲線で近似することで、大きく変倍しても高画質なベクトル記述データを生成する技術が開示されている。
表変換部229では、罫線部分を前述した公知のベクトル化技術によってベクトル描画データを生成し、文字部分を前述した公知の文字認識技術によって文字コードデータを生成する。
なお、文字変換部223、写真変換部225、線画変換部227、又は表変換部229では、上記以外の変換処理を行ってもよい。例えば、文字変換部223では、ベクトル変換を行ってもよいし、高画質ラスタデータ変換を行ってもよい。また、表変換部229では、高画質ラスタデータを生成してもよい。
合成部2210は、各変換部から生成されたデータを1つに合成する。図13は、合成部2210で合成されたデータの一例を示す図である。
1300は、合成部2210で生成されたデータの全体構成である。text object1301は、領域分割部221が文字と判断した領域の変換結果と画像中の位置情報を保持する。同様に、1302、1303、1304には、それぞれ写真、線画、表と判断した領域の変換結果と位置情報を保持する。1305は、入力データの書誌情報を有する。例えば、ページ数、ページサイズ、入力機器情報、タイムスタンプ等を保持する。
204は、合成データを電子ファイルに変換する電子ファイル変換部である。電子ファイル変換部204は、本実施形態では、PC120で再生、編集等が可能な電子ファイルへ変換する。
以上述べた通り、本実施形態によれば、色置換後に残存する領域がブロックの境界に位置する画素であって、それに対応するフラグデータが連続して存在していれば、色置換後に残存する領域を統合することにより色情報を統一する。これにより、同一の色情報を有する領域に対して色置換結果が統一できる。これにより、後処理の文字、写真等の領域分割の精度の劣化を防ぎ、生成する電子ファイルの閲覧性、再利用性を向上することができる。
<第2の実施形態>
上述の第1の実施形態では、色置換部213で色置換を行った後にブロック統合部214で隣接する2つのブロック内の領域の統合処理を行った。一方、本実施形態では、1つのブロック内の領域のみに着目するため、ブロックの境界を挟む領域統合は行わない点で異なる。なお、第1の実施形態と同様の構成については、同一の符号を付し、説明を省略する。
なお、本実施形態では、符号化対象の画像データは、説明を簡略化するため、RGBカラー画像データとするが、モノクロ画像データや、CMYKカラー画像データに適用してもよい。また、画像は水平方向W画素、垂直方向H画素により構成されるものとする。
図14は、第2の実施形態に係る画像処理装置の機能的構成を示すブロック図である。本実施形態に係る画像処理装置は、第1の実施形態の構成(図2参照)と基本的に同じであり、ブロック統合部214が符号化部1400に置き換えられ、画像解析部220及び電子ファイル変換部204が出力部1401に置き換えられた構成を備える。
また、本実施形態で想定する入力画像データは、例えば、ユーザモードで文書画像を処理するモードを設定した場合の画像データや、画像中の文字やCG等を前景画像として抽出して構成したような画像データを対象とする。
符号化部1400は、色置換部213で色置換された画像データに基づいて、符号化データを生成する。符号化方式としては、例えば、画素値等の連続数を符号化するランレングス(run−length)符号化を用いることができる。また、連続階調静止画像を完全に復元可能である可逆(ロスレス)圧縮、及び符号化時に多少の画質劣化を許容する準可逆(ニアロスレス)圧縮を選択可能な国際標準であるJPEG−LS(ISO/IEC14495−1及び2)等を用いることができる。
図15は、符号化部1400の機能的構成を示すブロック図である。また、図16は、タイルデータの一例を示す図である。本実施形態では、画像データを予測誤差に変換する系列変換の処理として周辺画素により予測変換を行い、符号化処理としてハフマン(Huffman)符号化を行うこととする。
符号化部1400は、バッファ1501、予測器1502、減算器1503、メモリ1504、ハフマン符号化器1505を有する。
バッファ1501は、信号線1506から順に入力されるタイルデータを2ライン分格納する。予測器1502は、バッファ1501から符号化対象画素の直前の画素aと、1ライン前の画素bのタイルデータを抽出し、p=(a+b)/2の演算を行うことにより予測値pを生成する。
減算器1503は、符号化対象画素のタイルデータxと予測値pとの差分値eを出力する。ハフマン符号化器1505は、予めメモリ1504に格納されたハフマンテーブルを参照して、差分値eに対応する符号化データを信号線1507から出力する。メモリ1504には、実際の符号化が行われる前に、いくつかのサンプル画像を予測符号化した際の予測誤差の頻度分布に基づいて生成されたハフマンテーブルが予め格納される。
ここで、予測誤差の頻度分布は、一般的に、予測誤差の絶対値が0に近いほど出現頻度が高く、予測誤差の絶対値が大きくなるにつれて出現頻度が低くなる傾向がある。このため、メモリ1504に格納されるハフマン符号は、予測誤差の絶対値が小さい範囲では短い符号語が割り当てられ、予測誤差の絶対値が大きい範囲では長い符号語が割り当てられる。
図17は、メモリ1504に格納されるハフマンテーブルの一例を示す図である。なお、符号化方式は、これに限定されるものではなく、色数が少なく、画素値の連続性の高い画像(例えば、文字画像やCG画像等)に対して効率良く符号化可能である方式であればよい。
一般的には、スキャン画像のように、ノイズの多く発生している画像に対して、可逆符号化方式を用いた場合には、符号化効率が悪いため、圧縮率を高めることができない。例えば、JPEG−LSを用いた場合には、画素値が連続する可能性が低いため、ランレングス符号化処理に入らず、予測符号化処理に入る可能性が高い。予測符号化処理は、予測が外れる可能性が高いため、長い符号長を割り当てる必要がある。このため、符号化データが冗長となる可能性がある。
しかし、本実施形態では、スキャン画像でも文字の一部等の重要情報(すなわち、上述のフラグデータ)を保持しており、ブロック内の画素値を色置換部213でノイズ除去のために減色処理する。このため、フラットな領域に対しては、画素値の連続性がかなり高くなり、ランレングス符号化等の可逆符号化方式で効率良く符号化することができる。
符号化部1400は、このようにして生成された符号化データを出力部1401に入力する。出力部1401は、入力された符号化データを画像データに変換して装置外部に出力する。
以上述べた通り、本実施形態によれば、減色処理された画像データに対して符号化処理を行うため、画素値の連続性を高めることによりランレングス符号化等の可逆符号化処理を行う割合を増加させることができる。これにより、符号データが冗長となることを抑制できるため、画素値の連続性が低い画像(例えば、ノイズの多いスキャン画像)に対しても効率良く符号化することが可能となる。
<その他の実施形態>
なお、本実施形態は、複数の機器(例えば、ホストコンピュータ、インターフェース機器、リーダ、プリンタ等)から構成されるシステムに適用しても、1つの機器からなる装置(例えば、複写機、複合機、ファクシミリ装置等)に適用してもよい。
また、本発明は、前述した実施形態の機能を実現するソフトウェアのコンピュータプログラムのコードを記憶したコンピュータ可読記憶媒体(又は記録媒体)を、システム又は装置に供給してもよい。また、そのシステム又は装置のコンピュータ(又はCPUやMPU)が記憶媒体に格納されたプログラムコードを読み込み実行することに適用してもよい。この場合、記憶媒体から読み込まれたプログラムコード自体が前述の実施形態の機能を実現することになり、そのプログラムコードを記録した記憶媒体は本実施形態を構成することになる。また、そのプログラムコードの指示に基づき、コンピュータ上で稼働しているオペレーティングシステム(OS)等が実際の処理の一部又は全部を行い、その処理によって前述した実施形態の機能が実現される場合も含まれることは言うまでもない。
さらに、記憶媒体から読み込まれたプログラムコードが、コンピュータに挿入された機能拡張カードやコンピュータに接続された機能拡張ユニットに備わるメモリに書き込まれる。その後、そのプログラムコードの指示に基づき、その機能拡張カードや機能拡張ユニットに備わるCPU等が実際の処理の一部又は全部を行い、その処理によって前述した実施形態の機能が実現される場合も本発明に含まれることは言うまでもない。
また、本実施形態を上述のコンピュータ可読記憶媒体に適用する場合、その記憶媒体には、前述のフローチャートや機能構成に対応するコンピュータプログラムのコードが格納されることになる。
本発明の第1の実施形態に係るシステムの機能的構成を示すブロック図である。 第1の実施形態に係る画像処理装置100の機能的構成を示すブロック図である。 (a)は入力された画像データを示す図であり、(b)は図3(a)で入力された画像データから生成された属性データを示す図である。 (a)は図3(b)で生成した属性データをフラグデータで示す図であり、(b)は図4(a)で示すフラグデータの変形例を示す図である。 (a)は類似色領域統合部210に入力された画像500を示す図であり、(b)はブロック分割部211で画像500を分割した状態を示す図である。 (a)は図5(b)で示すブロック501の色情報の分布を模式的に示す図であり、(b)は図5(b)で示すブロック504の色情報の分布を模式的に示す図である。 色置換部213の動作手順を示す図である。 (a)はブロック501を示す図であり、(b)はブロック501のフラグデータの一例を示す図であり、(c)は色置換後の画素領域800を示す図であり、(d)は色置換後の画像500を示す図である。 第1の実施形態に係るブロック統合部214の動作手順を示す図である。 (a)は着目ブロックと隣接ブロックの色置換後に残存する領域の一例を示す図であり、(b)は色置換後に残存する領域の色情報を模式的な色空間上に示したグラフを示す図である。 (a)は着目ブロックと隣接ブロックの色置換後に残存する領域の一例を示す図であり、(b)は図11(a)で示す領域のフラグデータの一例を示す図である。 ブロック統合後の画像500の状態を示す図である。 合成部2210で合成されたデータの一例を示す図である。 第2の実施形態に係る画像処理装置の機能的構成を示すブロック図である。 符号化部1400の機能的構成を示すブロック図である。 タイルデータの一例を示す図である。 メモリ1504に格納されるハフマンテーブルの一例を示す図である。

Claims (7)

  1. 画像データを入力する入力手段と、
    前記入力手段で入力した画像データの各画素毎に、属性情報を生成する属性情報生成手段と、
    前記入力手段で入力した画像データを、予め定められたサイズの複数のブロックに分割する分割手段と、
    前記分割手段で分割した着目ブロック内に出現する色と画素数のヒストグラムを生成する生成手段と、
    前記生成手段で生成したヒストグラムで得られた着目色を持つ領域の面積が予め定められた閾値よりも大きい場合、着目色の領域を有意な領域として決定する第1の決定手段と、
    前記生成手段で生成したヒストグラムで得られた着目色を持つ領域の面積が予め定められた閾値以下の場合であって、着目色の領域が着目ブロックの境界に位置し、且つ、前記着目色の領域内の前記境界の画素に対する、前記属性情報生成手段で生成された属性情報が、予め定められた属性を示す場合、前記着目色の領域が有意な領域として決定する第2の決定手段と、
    前記第1、第2の決定手段のいずれでも、前記着目色の領域が有意な領域として決定されなかった場合、前記着目色の領域の色を、当該着目色の領域が接する他の色の領域における色と同じ色とするため、前記着目色の領域内の画素の色を前記他の色に置換する置換手段と、
    を備えることを特徴とする画像処理装置。
  2. 前記属性情報生成手段は、着目画素が、該着目画素を含む領域のエッジに位置するか否かに基づいて、前記属性情報を生成することを特徴とする請求項1に記載の画像処理装置。
  3. 前記属性情報生成手段は、着目画素が、文字領域に含まれるか否かに基づいて、前記属性情報を生成することを特徴とする請求項1に記載の画像処理装置。
  4. 前記置換手段により置換された画像データに基づいて、符号化データを生成する符号化手段を更に備えることを特徴とする請求項1に記載の画像処理装置。
  5. 画像データを入力する入力工程と、
    前記入力工程で入力した画像データの各画素毎に、属性情報を生成する属性情報生成工程と、
    前記入力工程で入力した画像データを、予め定められたサイズの複数のブロックに分割する分割工程と、
    前記分割工程で分割した着目ブロック内に出現する色と画素数のヒストグラムを生成する生成工程と、
    前記生成工程で生成したヒストグラムで得られた着目色を持つ領域の面積が予め定められた閾値よりも大きい場合、着目色の領域を有意な領域として決定する第1の決定工程と、
    前記生成工程で生成したヒストグラムで得られた着目色を持つ領域の面積が予め定められた閾値以下の場合であって、着目色の領域が着目ブロックの境界に位置し、且つ、前記着目色の領域内の前記境界の画素に対する、前記属性情報生成工程で生成された属性情報が、予め定められた属性を示す場合、前記着目色の領域が有意な領域として決定する第2の決定工程と、
    前記第1、第2の決定工程のいずれでも、前記着目色の領域が有意な領域として決定されなかった場合、前記着目色の領域の色を、当該着目色の領域が接する他の色の領域における色と同じ色とするため、前記着目色の領域内の画素の色を前記他の色に置換する置換工程と、
    を有することを特徴とする画像処理方法。
  6. コンピュータに読み込ませ実行させることで、前記コンピュータを請求項1乃至4のいずれか1項に記載の画像処理装置として機能させることを特徴とするコンピュータプログラム。
  7. 請求項6に記載のコンピュータプログラムを格納したことを特徴とするコンピュータ可読記憶媒体。
JP2008217321A 2008-08-26 2008-08-26 画像処理装置及び画像処理方法 Expired - Fee Related JP5049921B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2008217321A JP5049921B2 (ja) 2008-08-26 2008-08-26 画像処理装置及び画像処理方法
US12/547,292 US8774511B2 (en) 2008-08-26 2009-08-25 Image processing apparatus and image processing method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008217321A JP5049921B2 (ja) 2008-08-26 2008-08-26 画像処理装置及び画像処理方法

Publications (3)

Publication Number Publication Date
JP2010056690A true JP2010056690A (ja) 2010-03-11
JP2010056690A5 JP2010056690A5 (ja) 2011-09-29
JP5049921B2 JP5049921B2 (ja) 2012-10-17

Family

ID=41725541

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008217321A Expired - Fee Related JP5049921B2 (ja) 2008-08-26 2008-08-26 画像処理装置及び画像処理方法

Country Status (2)

Country Link
US (1) US8774511B2 (ja)
JP (1) JP5049921B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010251927A (ja) * 2009-04-13 2010-11-04 Canon Inc 画像処理装置及び制御方法及びプログラム

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105915753B (zh) 2010-10-18 2019-01-04 杜比实验室特许公司 对图像数据进行解码及对视频信号进行编码的方法和设备
JP5645612B2 (ja) * 2010-11-09 2014-12-24 キヤノン株式会社 画像処理装置、画像処理方法、プログラム、及び記憶媒体
GB201217721D0 (en) * 2012-10-03 2012-11-14 Holition Ltd Video image processing
CN102989311B (zh) * 2012-11-16 2015-01-21 孙绍堂 生物除臭填料的制作方法及生物除臭填料
JP6489761B2 (ja) * 2014-05-14 2019-03-27 キヤノン株式会社 画像処理装置及び画像処理方法、プログラム
US10606242B2 (en) * 2015-03-12 2020-03-31 Canon Kabushiki Kaisha Print data division apparatus and program
CN111726639B (zh) * 2016-11-18 2023-05-30 上海兆芯集成电路有限公司 纹理砖压缩及解压缩方法以及使用该方法的装置

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3026592B2 (ja) 1990-10-22 2000-03-27 キヤノン株式会社 輪郭抽出方法及びその装置
US5680479A (en) 1992-04-24 1997-10-21 Canon Kabushiki Kaisha Method and apparatus for character recognition
US6731792B1 (en) * 1998-08-24 2004-05-04 Minolta Co., Ltd. Method and apparatus for accurately dividing a color image into proper regions, and storage media storing a program for executing such a method
JP2004046632A (ja) * 2002-07-12 2004-02-12 Minolta Co Ltd 画像処理装置
JP2004350240A (ja) 2003-05-26 2004-12-09 Canon Inc 画像処理装置及び画像処理方法
GB0317840D0 (en) * 2003-07-30 2003-09-03 Itw Ltd Sealing device
US7873218B2 (en) 2004-04-26 2011-01-18 Canon Kabushiki Kaisha Function approximation processing method and image processing method
EP1831823B1 (en) 2004-12-21 2011-03-09 Canon Kabushiki Kaisha Segmenting digital image and producing compact representation
US7623712B2 (en) * 2005-06-09 2009-11-24 Canon Kabushiki Kaisha Image processing method and apparatus
US7577314B2 (en) * 2006-04-06 2009-08-18 Seiko Epson Corporation Method and apparatus for generating a panorama background from a set of images
US8134742B2 (en) * 2006-07-07 2012-03-13 Canon Kabushiki Kaisha Output device and method for outputting density data corresponding to a color material to a printing unit
JP5049920B2 (ja) * 2008-08-26 2012-10-17 キヤノン株式会社 画像処理装置及び画像処理方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010251927A (ja) * 2009-04-13 2010-11-04 Canon Inc 画像処理装置及び制御方法及びプログラム

Also Published As

Publication number Publication date
US8774511B2 (en) 2014-07-08
JP5049921B2 (ja) 2012-10-17
US20100054591A1 (en) 2010-03-04

Similar Documents

Publication Publication Date Title
JP5049920B2 (ja) 画像処理装置及び画像処理方法
JP5049921B2 (ja) 画像処理装置及び画像処理方法
JP5132530B2 (ja) 画像符号化装置及び画像処理装置及びそれらの制御方法
US8320019B2 (en) Image processing apparatus, image processing method, and computer program thereof
US8331671B2 (en) Image processing apparatus and image encoding method related to non-photo image regions
JP5132517B2 (ja) 画像処理装置および画像処理方法
US8401306B2 (en) Image processing apparatus and control method
JP5137759B2 (ja) 画像処理装置
US20090284801A1 (en) Image processing apparatus and image processing method
JP4796486B2 (ja) 画像処理装置
JP6743092B2 (ja) 画像処理装置、画像処理の制御方法、及びプログラム
US8768051B2 (en) Image processing method, image processing apparatus, and computer-readable medium
JP5049922B2 (ja) 画像処理装置及び画像処理方法
US8810877B2 (en) Image processing apparatus, image processing method, and storage medium for eliminating blurring of scanned image
JP2010146218A (ja) 画像処理装置、画像処理方法、コンピュータプログラム
US8270722B2 (en) Image processing with preferential vectorization of character and graphic regions
JP2007088912A (ja) 画像処理装置およびプログラム
JP2008206073A (ja) 画像処理装置、制御方法、プログラム、及び記憶媒体
JP7134045B2 (ja) 画像処理装置と画像処理方法、及びプログラム
JP5517028B2 (ja) 画像処理装置
JP7301529B2 (ja) 画像処理装置、画像処理方法、及びプログラム
JPH09167222A (ja) 画像処理装置
JP7185451B2 (ja) 画像処理装置と画像処理方法、及びプログラム
JP2006262258A (ja) 画像処理装置、画像処理方法及びプログラム
JP2008165538A (ja) 画像処理装置及び画像処理装置の制御方法

Legal Events

Date Code Title Description
A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110812

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20110812

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20120615

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120625

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120723

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150727

Year of fee payment: 3

R151 Written notification of patent or utility model registration

Ref document number: 5049921

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

LAPS Cancellation because of no payment of annual fees