JP2007174522A - 画像処理装置、画像処理方法、プログラムコード及び記憶媒体 - Google Patents

画像処理装置、画像処理方法、プログラムコード及び記憶媒体 Download PDF

Info

Publication number
JP2007174522A
JP2007174522A JP2005372430A JP2005372430A JP2007174522A JP 2007174522 A JP2007174522 A JP 2007174522A JP 2005372430 A JP2005372430 A JP 2005372430A JP 2005372430 A JP2005372430 A JP 2005372430A JP 2007174522 A JP2007174522 A JP 2007174522A
Authority
JP
Japan
Prior art keywords
image
image processing
character
processing apparatus
character area
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2005372430A
Other languages
English (en)
Inventor
Tomotoshi Kanatsu
知俊 金津
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2005372430A priority Critical patent/JP2007174522A/ja
Publication of JP2007174522A publication Critical patent/JP2007174522A/ja
Withdrawn legal-status Critical Current

Links

Images

Landscapes

  • Image Analysis (AREA)
  • Facsimile Image Signal Circuits (AREA)
  • Color Image Communication Systems (AREA)
  • Compression Of Band Width Or Redundancy In Fax (AREA)

Abstract

【課題】 部分画像を保持できる程度の少ないメモリを用いて、画像全体の文字領域の属性を判定すること。また判定された文字領域を用いて、高画質で圧縮効率のよい圧縮データを生成すること。
【解決手段】 部分画像を順次取得することにより、互いに隣接する複数の部分画像を保持する画像保持手段と、前記画像保持手段に保持されている複数の部分画像から選択可能な文字領域を選択する選択手段と、前記選択された文字領域の属性を判定する属性判定手段とを有する。
また、画像保持手段に保持された画像の解像度を落とすとともに、文字領域に相当する画素群の色を塗りつぶすことによって下地画像を生成する下地画像生成手段と、文字領域を圧縮する文字領域圧縮手段と、下地画像を圧縮する下地画像圧縮手段とを更に有する。
【選択図】 図7

Description

本発明は、文字領域を含む画像を圧縮する技術に関するものである。
画像の圧縮方法としてJPEGが知られている。文字領域を含むカラー画像を効率良く圧縮する方法としては例えば下記の件が知られている。
下記文献には、文字領域とそれ以外との画像を分離し、それぞれ別途圧縮することにより、効率の良い圧縮を実現することが開示されている。
ところで、カラー画像全体を展開するには大きなメモリ必要とする。一般的に画像に対する処理を省メモリで動作させるためには、カラー文書画像をラスターデータに変換し、そのラスターデータを帯状のバンドに分割して順次処理を行なうことが知られている。(バンド処理)
特開2002−77633号公報 特開2003−018413号公報 特開2003−008909号公報
従来、既に圧縮された画像から更に高圧縮率で圧縮された画像データに符号変換する場合において、圧縮された画像の文字領域の属性を判定するには、画像全体を一旦展開する為のメモリ等が必要であった。また圧縮データを伸張することで得られる画像データに関わらず、画像全体を表す画像データを保持するメモリが必要であった。
本発明はかかる事情に鑑みてなされたものであって、部分画像を保持できる程度の少ないメモリを用いて、画像全体の文字領域の属性を判定することを主な目的とする。また判定された文字領域を用いて、高画質で圧縮効率のよい圧縮データを生成することを主な目的とする。
上記目的を達成するために、本発明の画像処理装置は、部分画像を順次取得することにより、互いに隣接する複数の部分画像を保持する画像保持手段と、前記画像保持手段に保持されている複数の部分画像から選択可能な文字領域を選択する選択手段と、前記選択された文字領域の属性を判定する属性判定手段とを有することを特徴とする。
また本発明の画像処理装置は、画像保持手段に保持された画像の解像度を落とすとともに、文字領域に相当する画素群の色を塗りつぶすことによって下地画像を生成する下地画像生成手段と、文字領域を圧縮する文字領域圧縮手段と、下地画像を圧縮する下地画像圧縮手段とを更に有することを特徴とする。
部分画像を保持できる程度の少ないメモリを用いて、画像全体の文字領域の属性を判定することができる。また判定された文字領域を用いて、高画質で圧縮効率のよい圧縮データを生成することができる。
<実施形態1>
図1は本実施形態におけるハードウェア構成を示す図である。
101は装置の制御をおこなうCPUである。102はCPU101のプログラムやデータを保持するRAMである。103はプログラムデータやデータを記憶するハードディスク装置である。
104はエンコード・デコードや特殊な画像処理をソフトウェアよりも高速に実行する画像処理ハードウェアである。105は装置とオペレータ間で情報を入出力する、ディスプレイ・キーボードなどのUI装置である。106は紙原稿の内容を電気信号に変換するスキャナである。
107は外部機器と接続するネットワークインタフェースであり、それらはバス108により相互に接続されている。
図2に本実施形態の画像処理装置の動作要素を示す。本図の各要素を用いることにより、スキャン画像から圧縮データを生成する。
201はスキャナ等により生成された画像データを入力する画像入力部である。202は画像データをJPEG圧縮するJPEGエンコーダ部である。203はJPEG圧縮データである画像データを保存するカラー画像記憶部である。204はJPEG圧縮データをラスターデータに展開(伸長)するJPEGデコーダ部である。
205は画像データの輝度ヒストグラムを格納するヒストグラムバッファ部である。206は画像データを二値化した二値画像データを格納する二値画像バッファ部である。207は画像データから部分画像データを抽出することにより得られたテキストブロック情報を格納するブロック情報バッファ部である。208はテキストブロック内を、行および文字単位に分割して得られる情報を格納するセグメント矩形情報バッファ部である。
209はJPEG圧縮データを展開(伸長)して得られた画像データを一時保存するカラー画像展開バッファ部B0である。210もJPEG圧縮データを展開(伸長)して得られた画像データを一時保存するカラー画像展開バッファ部B1である。211は下地となる縮小カラー画像を保存する下地画像バッファ部である。212は文字領域部を圧縮するMMRエンコーダ部である。213は下地画像と二値画像の圧縮データを合成するデータ合成部である。214は合成された圧縮データを出力するデータ出力部である。
図3は、本実施形態における画像処理装置が、スキャン画像から圧縮データを生成する処理を示すフローチャートである。
ステップS301にて、紙原稿の1ページをスキャナなど読み取ることにより電子データに変換する。ここでは、光電変換によりR,G,Bの3原色各8ビット、計24ビットのカラー画像データが得られる。この画像データは処理ラインごとに、YCbCrに色空間変換された後、JPEG圧縮されて記憶装置に保存される。このJPEG圧縮データとなっている画像データをWとする。
ステップS302にて、画像データWが表す全画像(1ページ分の画像)の輝度ヒストグラムを作成する。具体的には、輝度(Y)、色差青(Cb)、色差緑(Cr)の3要素のJPEG圧縮データのうち、輝度成分(Y)のみを展開(JPEG伸長)してヒストグラムを作成する。なお、輝度成分を展開して輝度ヒストグラムを作成するのは、JPEG圧縮データの最小処理ユニットの1つずつについて作成すれば良いので、そこでの展開に使用するメモリ容量は8×8画素分で十分である。
なお、すべての画素を展開する必要はない。例えば、JPEG圧縮データの最小処理ユニット(8×8画素)の直流成分(DC成分)として抽出した各ユニットの平均の輝度値のヒストグラムを作成すれば、高速に上記ヒストグラムの作成と類似の結果を得ることもできる。
ステップS303ではJPEG圧縮データWの輝度成分を再度展開(伸長)しながら、各画素をある閾値を用いて二値化し、ここで得られた二値データを二値画像バッファ部206に保存する。ここで得られた1ページ分の二値画像をZとする。なお、このとき用いる閾値は先に作成した1ページ分のヒストグラムに基づいて決定するので、処置対象となるページの画像データに適切な二値画像を得ることができる。
ステップS304では二値画像Zから部分領域を抽出し、テキストブロックの集合を得る。
この部分領域を抽出する方法は、画像データの内容を分析し、文字や図、写真、表など、異なる性質の画像を認識し、それぞれの性質のまとまった画像を部分領域として抽出するものである。この結果に基づいて上記テキストブロックが抽出される。このテキストブロックとは、文字で構成される行を複数含む集合である。そして1つのテキストブロック内の各行は近接しているものとする。よって、まとまった意味を持つ文章を構成する可能性が高い。また、テキストブロック内の文字は一般的に大きさ、色などの性質が似ているものが得られる。
なお、具体的な部分領域の抽出方法は公知であるので詳細な説明は省略する。たとえば、画像中の黒画素の塊、白画素の塊の集合を検出し、その形状、大きさ、集合状態等の特徴量に基づいて、文字、絵や図、表、枠、線といった性質の部分領域を抽出することができる。
ステップS305にて、上記テキストブロックから文字の各要素に相当するセグメント矩形を抽出する。セグメント矩形の抽出方法は、まずテキストブロック内を二値化して得られた二値画像データに対し、縦方向及び横方向の2方向の射影を行い、山谷があるほうを行方向の射影であると認識する。そしてその射影の谷の位置で画像を短冊状に分割したものを行とする。さらにその行毎に、行方向に垂直な射影を行い、射影の切れ目で短冊を分割することによりセグメント矩形が得られる。即ち、セグメント矩形とは、1文字を構成する要素のひとまとまりを囲む矩形である。
ステップS306では、画像データの画素値を参照して、セグメント矩形毎に文字領域部分の画素の平均色と色分散を求める。ここで画像データの画素値を参照する方法は後述する。
ステップS307にて、分散の大きいセグメント矩形を非文字属性セグメントと判断し、二値画像上で矩形内にあたる画素値を0にする。さらに、この非文字属性セグメントの割合が一定より大きいブロックは非テキストブロックであると判定結果を修正する。
なお、前記S306において、セグメント矩形毎ではなく、テキストブロック自体の平均色と色分散を求めてもよい。そしてこの結果により、S307において、テキストブロックが、テキストブロックか非テキストブロックかを判定する。これにより、例えば、少数の文字で構成されるテキストブロックなどの判定処理を軽減できる。また、少数の文字で構成されるテキストブロックの属性の判定には、テキストブロック自体の平均色と色分散から属性を求め、多数の文字で構成されるテキストブロックの属性の判定にはセグメント矩形毎の平均色と色分散からテキストブロックの属性の判定を行なうようにしてもよい。これにより、テキストブロックのサイズに応じた処理を行なうことでテキストブロックの属性の判定処理を効率化できる。
以上の処理により、グラデーションを有する文字や、色彩に富んだ非文字が存在する場合に、その部分が文字領域部分として処理されないようになる。また、部分領域を抽出する処理自体の誤判定により、ブロック自体が非テキストとなっている状態が修正される。
ステップS308にて、セグメント矩形毎に求められた色をテキストブロック内でグループ化し、各グループの代表色を求める。グループ数が多くなる場合は、テキストとして処理するにはふさわしくないとして、このブロックの判定結果を非テキストブロックであると修正する。
ステップS309では、各セグメント矩形の色として、セグメント矩形に代表色のいずれかを割り当てる。
ステップS310にて、画像データWを半分の解像度にした画像データXをテキストブロック内の文字領域部分にあたる画素、すなわち二値画像で1に相当する画素を背景色で塗りつぶすことにより、下地部分を作成する。下地部分の色は、テキストブロック内の二値画像で0に相当する画素を半分の解像度の画像データから抽出し、該画素の色成分の平均色を用いる。さらにこの下地部分はJPEG等で圧縮する。
ステップS311にて、各テキストブロックのセグメント矩形領域内の二値画像をその領域の文字領域部分としてMMR等で圧縮する。ここで、2グループ以上の代表色の割り当てられたブロックでは、各色毎、その色に割り当てられたセグメント矩形内の二値画像の画素のみを有効にして色数分の圧縮画像データを作成する。あるいは2〜4ビット程度を用いてパレット付きの多ビット画像で表現し、ZIPやLZWなどの形式で圧縮してもよい。
ステップS312にて、各領域の文字領域部分およびその位置、下地部分を合わせたものをページの圧縮画像データとして出力する。
以上が画素処理装置が圧縮データを生成する手順である。
次に、上記のステップS306〜ステップS309に相当する部分について、図4のフローチャートを用いて、より詳細に説明する。
なお、図4の処理に際し、ステップS304により得られたテキストブロック集合{Tx}=T1,T2,...Tkは、各々ステップS305の処理により得られたセグメント矩形集合を保持している。
ステップS401にて、JPEGデコーダ部204は、画像データの上端からnライン(n=64)分の画像データを画像バッファ部B0(209)へと展開(伸長)する。
図6に例を示すならば、元画像の601の部分、Y[0]〜Y[n−1]の範囲の画像データが画像バッファB0[0]〜B0[n−1]へと展開(伸長)される。
ステップS402にて、JPEGデコーダは、画像データを新たにnライン分、バッファに復号画像を展開(伸長)する。ここでJPEGデコーダは2つの画像バッファ部B0(209)またはB1(210)を交互に用いる様にして、直前に展開されたバッファとは異なるバッファへと復号画像を展開する。
図6の例では、ステップS401の直後は602の部分、Y[n]〜Y[2n−1]の範囲の画像データが画像バッファB1[0]〜B1[n−1]へ展開される。以降、k番目のステップS402処理(k=1,2,...t)において、Y[kn]〜Y[kn+n−1]の範囲のデータは、kが偶数のときはB0[0]〜B0[n−1]、kが奇数のときはB1[0]〜B1[n−1]へと展開されることになる。
なお、本実施形態では、画像バッファはB0、B1の2つを用いているが、これに限ったことではなく、3つ以上のバッファを用いて同様の処理を行っても良い。また複数範囲の画像データを持つことができる1つのバッファを用いてもよい。
ステップS403では、現在、画像バッファ209,210に展開されている画像範囲に、セグメント矩形集合の矩形領域が重なるテキストブロックを、テキストブロック集合{Tx}から選出する。そして選出されたテキストブロックを、色抽出を処理する対象であるテキストブロック集合{Te}に移動する。
図7に例を示すと、701の範囲、702の範囲の復号画像がそれぞれ画像バッファB0(209),B1(210)に展開されている場合、テキストブロック703,704,705のうち、703と705がテキストブロック集合{Te}に移動する。
ステップS404では、テキストブロック集合{Te}に属する各テキストブロックに対して色抽出処理を開始する。
なお本処理は、処理を行なっているブロック内のセグメント矩形について、その時点で画像バッファ209、210に展開されている範囲から、情報取得が可能なセグメント矩形について順次色情報を抽出していく。そしてブロック内すべてのセグメント矩形の情報が得られた時点で判定をおこない、処理を行なっているブロックをテキストブロック集合{Td}に移すか、非テキストブロックとしてテキストブロック集合{Nt}に移すかを決定する。
さらに、まだ画像バッファB0(209),B1(210)に展開されていない下方の画像を展開しないと情報が取得できないセグメント矩形が残る場合は、処理ブロックを{Te}に残したままで次のブロックに対する処理をおこなう。なお、ステップS404でおこなわれる処理の詳細は後述する。
ステップS405にて、ステップS402での展開先が画像バッファ部B1(210)の場合は画像バッファ部B0(209)の画像を、1/2したものを下地画像バッファ部211にn/2ライン分追加する形で書き出す。バッファB0の場合はバッファB1の画像を1/2したものを下地画像バッファにn/2ライン分追加する形で書き出す。
ステップS406にて、展開していないJPEG圧縮画像データがまだ存在する場合は、ステップS402に戻って同様の処理を繰り返す。JPEG圧縮画像データが存在しない場合は、ステップS407へ進む。
ステップS407にて、最後の展開先が画像バッファB0なら画像バッファ部B0の画像データを、1/2に縮小して下地画像バッファ部211に書き出して終了する。最後の展開先が画像バッファB1なら画像バッファ部B1の画像を1/2に縮小して下地画像バッファ部211に書き出して終了する。
ステップS401〜ステップS407の処理が終了すると、下地画像バッファ部211には、画像データWに対し半分の解像度の画像データが展開されている。また部分領域を抽出する処理によって得られたテキストブロックから非文字部分を除いた情報(文字領域情報)が得られている。これらを用いてS310以降の処理をおこなうことで、出力となる圧縮画像データが得られることになる。
以下、図5のフローチャートを用いて、ステップS404でおこなわれる処理の詳細なステップを説明する。
ステップS404では、テキストブロック集合{Te}の要素Tmに対する色抽出処理をおこなうものである。このときの画像バッファにはY[p]〜Y[p+2n−1]の範囲のラスターデータが展開されている。Y[]へのアクセスに際しては、画像バッファB0が先に展開されている状態では
Y[p]〜Y[p+2n−1] → B0[0]〜B0[n−1],B1[0]〜B1[n−1]
画像バッファB1が先に展開されている状態では
Y[p]〜Y[p+2n−1] → B1[0]〜B1[n−1],B0[0]〜B0[n−1]
の変換がおこなわれるものとする。
ステップS501にて、テキストブロックTmが持つセグメント矩形集合{U}に対し、属性未判定のセグメント矩形を集めて集合{Uq}=Uq1,Uq2,...,Uqjを作成する。ここで本処理がTmに対する初回の色抽出処理の場合は{Uq}={U}となる。2回目以降の処理の場合は、前回処理で未判定のままのセグメント矩形からなる{Uq}が引き続き使われるものとする。
ステップS502にて、未処理であるセグメント矩形のカウンタをi=1とする。
ステップS503にて、i番目のセグメント矩形Uqiの外接座標が(x0,y0)−(x1,y1)のとき、その下端y1が、ラスタ展開されている画像範囲p+2n−1を超える場合はステップS504に進む。それ以外はステップS505に進む。
ステップS504では、セグメント矩形Uqiの上端y0がp+n−1を超える場合はUqiを{Uq}に残したままステップS510に進む。それ以外はステップS505に進む。それ以外はステップS507に進む。
ステップS505にて、まず、セグメント矩形Uqiの内部の文字領域画素、すなわちx0≦x≦x1,y0≦y≦y1の範囲でかつ二値画像の画素I(x,y)=1となる座標集合をCとする。そして画素値の集合P(x,y),(x,y)∈Cの平均値Pavおよび分散Pdを算出する。
ステップS506にて、分散Pdを閾値Tdと比較し、Pd>Tdの場合はステップS507に進み、Pd≦Tdの場合ステップS509に進む。なお、閾値Tdは、事前に設定しておくことが好ましい。
ステップS507にて、セグメント矩形Uqiを非文字属性セグメントと判定して{Uq}から除去する。
続いてステップS508にて、二値画像I上で矩形内(x0≦x≦x1,y0≦y≦y1の範囲)の画素を0にする。
一方ステップS509では、セグメント矩形Uqiを文字属性セグメントと判定して{Uq}から{Ut}へ移動する。
ステップS510にて、i<=jならステップS511に進み、i++してステップS503に戻る。i>jならステップS512に進む。
ステップS512にて、{Uq}に残っているセグメント矩形、すなわち展開された画像範囲の下端p+2n−1よりも下にはみ出しているセグメント矩形の数をカウントする。カウント数が0ならばこのブロックに対する色抽出処理を確定するためにステップS513に進む。0より大ならば、このテキストブロックTmに対する色抽出処理は未完了とし、Tmは{Te}に残したまま終了する。
ステップS513にて、Tm中のセグメント矩形集合{U}の総数Naに対し、その中で非文字属性セグメントと判定された矩形数Npの割合を閾値Tnと比較する。なおNpはNa−文字属性セグメント矩形集合{Ut}の数に等しい。割合がTn以下の場合はステップS514に進む。割合がTnより大な場合はステップS518に進む。
ステップS514にて、文字属性セグメント矩形集合{Ut}の矩形夫々が保持している平均色をグループ化する。具体的にはRGB空間やYCbCr空間に各矩形に色をプロットし、距離の近接するものをグループ化する。
ステップS515にて、ステップS514で求められたグループ数に閾値Cを設定し、そのグループ数が閾値C超えていないならばステップS516に進む。超えている場合はステップS518に進む。この判定は、色再現性を確保するために、色数の多すぎるブロックをテキストとして扱わないようにする処理である。具体的な閾値は、グループ数は原稿種、テキスト内容によって各々異なるが、5〜8色程度とすることが好ましい。なお、グループ数だけではなく、グループ作成時に分散を求めてその大きさで判定してもよい。
ステップS516にて、テキストブロックTmをテキストブロックと確定し、{Te}から取り除いて、確定済みテキストブロック集合{Td}に加える。
ステップS517にて、テキストブロックTm中の文字属性セグメント矩形{Ut}の要素をステップS514のグループに分配する。さらに各グループの要素でセグメント矩形色を平均化して代表色を求め、グループ内のセグメント矩形色を代表色に置きかえる。
ステップS518にて、ブロックTmはテキストブロックとみなさないのが適当と判断し、色抽出処理の対象であるテキストブロック集合{Te}から取り除いて、非テキストブロック集合{Nt}に加える。
以上、ステップS501〜ステップS518により、処理対象のブロックTmは確定済みのテキストブロック集合{Td}と非テキストブロック集合{Nt}のどちらかに加えられる。あるいは、属性の確定しないセグメント矩形が残るため未判定のまま{Te}に残る。
図8に例を示すと、テキストブロック805は、最初801と802がバッファB0およびB1に展開された状態で{Te}にエントリーされる。色抽出処理によってテキストブロック805内のセグメント矩形のうち806と807の属性が確定するが、808の属性は確定しないため{Te}に残る。次に802と803がバッファに展開された状態での色抽出処理でセグメント矩形808の属性が確定するので、テキスト/非テキストが判定され、{Td}または{Nt}に移動する。
以上、本実施形態の画像処理装置は、JPEG圧縮画像データを、限定された2つのバッファへ交互にデコードしながら各テキストブロック内部のセグメント矩形の色情報を取得し、バッファの画像データは縮小し下地部分として活用する。
本実施の形態によれば、部分画像を保持できる程度の少ないメモリを用いて、画像全体の文字領域の属性を判定することができる。また判定された文字領域を用いて、高画質で圧縮効率のよい圧縮データを生成することができる。
<実施形態2>
本実施形態では、スキャナから読み込まれた画像に対して、図3のステップS301からステップS305までの処理と、ブロック単位で展開(伸張)する処理(S401、S402)を外部装置で行なう。外部装置と符号化装置の処理能力に応じて処理を分散させることで処理効率がよくなる。
図9に本実施形態における装置構成のブロック図を示す。
901は符号化装置、902は外部装置である。901a、902aは装置の制御をおこなうCPUである。901dはCPU901aのプログラムやデータを保持するRAMであり、902dはCPU902aのプログラムやデータを保持するRAMである。902fはブロック単位で取り出されたJPEG圧縮データを展開(伸張)するデコーダである。902gは装置とオペレータ間で情報を入出力するディスプレイ・キーボードなどのUI装置である。
902iはプログラムデータやデータを記憶するハードディスク装置である。902hは紙原稿の内容を電気信号(画像データ)に変換するスキャナ装置である。901b、902bは外部機器と接続するネットワークインタフェースである。901e、902eはそれぞれの装置を接続するバスであり、903は符号化装置901と外部装置902を繋ぐ通信線である。なお、スキャナ装置902hは、外部装置902の外部にあってもよい。
次に本実施形態の符号化装置並びに外部装置において、上記スキャンされた画像の圧縮データを生成する処理を図3を用いて説明する。
ステップS301にて、外部装置902は紙原稿をスキャナで電子化し、JPEG圧縮された画像データWをハードディスク装置902iに保存する。
ステップS302、S303にて、外部装置902は画像データWから画像一面範囲の輝度ヒストグラムを作成する。そして外部装置902は作成した輝度ヒストグラムから二値画像Zを作成する。
ステップS304、S305にて、外部装置902は二値画像Zに領域分割を施し、テキストブロックの集合を得る。そして各テキストブロックからセグメント矩形を抽出する。
そして外部装置902は、二値画像Zと、テキストブロックの集合を表す情報と、セグメント矩形を表す情報を、符号化装置901内のRAM901dに送信する。また、外部装置902内のデコーダ902fは、カラー画像の上端からnライン(n=64)分の画像データを、符号化装置901内のRAM901dに送信する。以後、nライン分の画像データを、全体の処理が終わるまでRAM901dに送信する。
符号化装置901は、外部装置902から送信されたnライン分の画像データを入力し、ステップS306からステップS312までの処理を行なう。処理方法は実施形態1と同様であるので省略する。
以上が符号化装置と外部装置において圧縮データを生成する処理手順である。
本実施形態では、スキャナ等で得られた画像データに対して、図3のステップS301からステップS305までの処理と、ブロック単位で展開(伸張)する処理(S401、S402)を外部装置で行なったが、本発明はこれに限らない。例えば、ブロック単位で展開(伸張)する処理のみを外部装置が行なってもよい。
なお、本発明は、2つ以上の複数の機器(例えばホストコンピュータ、インタフェイス機器、リーダ、プリンタなど)から構成されるシステムに適用してもよい。
<他の実施形態>
本発明は上記実施形態を実現する為の装置及び方法のみに限定されるものではない。上記システム又は装置内のコンピュータ(CPUあるいはMPU)に、上記実施形態を実現する為のソフトウェアのプログラムコードを供給し、このプログラムコードに従って上記システムあるいは装置のコンピュータが上記各種デバイスを動作させる。これにより上記実施形態を実現する場合も本発明の範疇に含まれる。
またこの場合、ソフトウェアのプログラムコード自体が上記実施形態の機能を実現することになる。つまり、そのプログラムコード自体、及びそのプログラムコードをコンピュータに供給する為の手段、具体的には上記プログラムコードを格納した記憶媒体は本発明の範疇に含まれる。
この様なプログラムコードを格納する記憶媒体としては、例えばフロッピー(登録商標)ディスク、ハードディスク、光ディスク、光磁気ディスク、CD−ROM、磁気テープ、不揮発性のメモリカード、ROM等を用いることができる。
また、上記コンピュータが、供給されたプログラムコードのみに従って各種デバイスを制御することにより、上記実施形態の機能が実現される。またこの場合だけではなく、上記プログラムコードがコンピュータ上で稼働しているOS(オペレーティングシステム)、あるいは他のアプリケーションソフト等と共同して上記実施形態が実現される場合にもかかるプログラムコードは本発明の範疇に含まれる。
更に、この供給されたプログラムコードの指示に基づいてコンピュータの機能拡張ボードやコンピュータに接続された機能格納ユニットに備わるCPU等が処理の一部又は全部を行い、その処理によって上記実施形態が実現される場合も本発明の範疇に含まれる。
実施形態1における画像処理装置の基本構成を示す図である。 実施形態1における画像処理装置の動作要素のブロック図である。 実施形態1におけるスキャン画像より圧縮データを生成する処理のフローチャートである。 図3のステップS306〜S309の詳細を示したフローチャートである。 図4のステップS404の詳細を示したフローチャートである。 ラスタ画像バッファB0、B1である。 ラスタ画像バッファB0、B1がカラー画像に展開していることを示す図である。 ラスタ画像バッファB0、B1がカラー画像に展開していることを示す図である。 実施形態2における画像処理装置の動作要素のブロック図である。
符号の説明
201 画像入力部
202 JPEGエンコーダ部
203 カラー画像記憶部
204 JPEGデコーダ部
205 ヒストグラムバッファ部
206 二値画像バッファ部
207 ブロック情報バッファ部
208 セグメント矩形情報バッファ部
209 カラー画像展開バッファ部B0
210 カラー画像展開バッファ部B1
211 下地画像バッファ部
212 MMRエンコーダ部
213 データ合成部
214 データ出力

Claims (20)

  1. 部分画像を順次取得することにより、互いに隣接する複数の部分画像を保持する画像保持手段と、
    前記画像保持手段に保持されている複数の部分画像から選択可能な文字領域を選択する選択手段と、
    前記選択された文字領域の属性を判定する属性判定手段とを有することを特徴とする画像処理装置。
  2. 画像中の文字領域を示す情報を保持する領域情報保持手段と、
    前記画像の部分画像を順次取得することにより、互いに隣接する複数の部分画像を保持する画像保持手段と、
    前記文字領域を示す情報に基づいて、前記保持手段に保持されている複数の部分画像から選択可能な文字領域を選択する選択手段と、
    前記選択された文字領域の属性を判定する属性判定手段とを有することを特徴とする画像処理装置。
  3. 前記選択手段は、選択可能な文字領域として、文字の集合である文字ブロック内の文字の構成要素を囲む矩形を選択することを特徴とする前記請求項1または2に記載の画像処理装置。
  4. 前記属性判定手段は、前記文字ブロック内の文字の構成要素を囲む矩形毎の平均色と色分散から、該矩形が文字か非文字かの属性を判定することを特徴とする前記請求項3に記載の画像処理装置。
  5. 前記画像処理装置は、前記判定された属性に基づいて、文字ブロックが文字ブロックか非文字ブロックかの属性を判定することを特徴とする前記請求項4に記載の画像処理装置。
  6. 前記選択手段は、選択可能な文字領域として、文字の集合である文字ブロックを選択することを特徴とする前記請求項1または2に記載の画像処理装置。
  7. 前記文字領域を示す情報は、前記画像を二値化した二値画像情報、または前記二値画像に基づいて検出された文字ブロック情報、または前記文字ブロック内の文字の構成要素を囲む矩形を表す矩形情報の少なくとも一つであることを特徴とする前記請求項2に記載の画像処理装置。
  8. 前記文字領域を示す情報は、
    前記画像から二値画像を生成する二値画像生成手段と、
    前記二値画像から文字ブロック情報を抽出する抽出手段と、
    前記文字ブロック内の文字の構成要素を囲む矩形を認識する認識手段と、
    を用いて生成されることを特徴とする前記請求項2に記載の画像処理装置。
  9. 前記画像保持手段は、画像をn(n>1)分割した画像領域の内m(n≧m>0)番目の部分画像とm+1番目の部分画像を保持することを特徴とする前記請求項1または2に記載の画像処理装置。
  10. 前記画像保持手段は、2つ以上のバッファにより構成されることを特徴とする前記請求項1または2に記載の画像処理装置。
  11. 前記画像保持手段は、2k(kは0以上の整数)番目の部分画像を保持する第1の画像保持手段と、
    2k+1番目の部分画像を保持する第2の画像保持手段とを有することを特徴とする前記請求項1または2に記載の画像処理装置。
  12. 前記画像処理装置は更に、
    圧縮された画像データを伸張する伸張手段を有し、前記伸張手段は、n分割された画像領域を順次伸張して前記画像保持手段に保持させることを特徴とする前記請求項1または2に記載の画像処理装置。
  13. 前記画像処理装置は更に、
    入力された画像データを圧縮する圧縮手段を有することを特徴とする前記請求項12に記載の画像処理装置。
  14. 前記圧縮手段はJPEG圧縮に準拠した圧縮を行なうことを特徴とする前記請求項13に記載の画像処理装置。
  15. 前記選択手段は、前記画像保持手段に保持されている部分画像内に包含されている文字領域を判別することを特徴とする前記請求項3または6に記載の画像処理装置。
  16. 前記画像処理装置は、画像保持手段に保持された画像の解像度を落とすとともに、文字領域に相当する画素群の色を塗りつぶすことによって下地画像を生成する下地画像生成手段と、
    文字領域を圧縮する文字領域圧縮手段と、
    下地画像を圧縮する下地画像圧縮手段と
    を更に有することを特徴とする前記請求項1乃至15に記載の画像処理装置。
  17. 部分画像を順次取得することにより、互いに隣接する複数の部分画像を保持手段に保持する画像保持工程と、
    前記保持手段に保持されている複数の部分画像から選択可能な文字領域を選択する選択工程と、
    前記選択された文字領域の属性を判定する属性判定工程とを有することを特徴とする画像処理方法。
  18. 前記画像処理方法は、画像保持手段に保持された画像の解像度を落とすとともに、文字領域部の画素を塗りつぶすことによって下地画像を生成する下地画像生成工程と、
    文字領域を圧縮する文字領域圧縮工程と、
    下地画像を圧縮する下地画像圧縮工程と
    を更に有することを特徴とする前記請求項17に記載の画像処理方法。
  19. 請求項17または18のいずれか1項に記載の画像処理方法を実行するプログラムコード。
  20. 請求項19に記載のプログラムコードを格納し、コンピュータが読み取り可能な記憶媒体。
JP2005372430A 2005-12-26 2005-12-26 画像処理装置、画像処理方法、プログラムコード及び記憶媒体 Withdrawn JP2007174522A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2005372430A JP2007174522A (ja) 2005-12-26 2005-12-26 画像処理装置、画像処理方法、プログラムコード及び記憶媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005372430A JP2007174522A (ja) 2005-12-26 2005-12-26 画像処理装置、画像処理方法、プログラムコード及び記憶媒体

Publications (1)

Publication Number Publication Date
JP2007174522A true JP2007174522A (ja) 2007-07-05

Family

ID=38300454

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005372430A Withdrawn JP2007174522A (ja) 2005-12-26 2005-12-26 画像処理装置、画像処理方法、プログラムコード及び記憶媒体

Country Status (1)

Country Link
JP (1) JP2007174522A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012077019A (ja) * 2010-09-30 2012-04-19 Snow Brand Milk Products Co Ltd 皮膚コラーゲン産生促進剤

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012077019A (ja) * 2010-09-30 2012-04-19 Snow Brand Milk Products Co Ltd 皮膚コラーゲン産生促進剤

Similar Documents

Publication Publication Date Title
TWI230516B (en) Segmented layered image system
CN102577345B (zh) 图像处理设备及其处理方法
US7120297B2 (en) Segmented layered image system
JP5132530B2 (ja) 画像符号化装置及び画像処理装置及びそれらの制御方法
US8503036B2 (en) System and method of improving image quality in digital image scanning and printing by reducing noise in output image data
JPH08235346A (ja) 画像処理装置
JP2005020227A (ja) 画像圧縮装置
JP2007158510A (ja) 画像処理装置及びその制御方法、並びに、コンピュータプログラム及びコンピュータ可読記憶媒体
JP3715905B2 (ja) 画像処理装置、画像処理方法、プログラム並びに記憶媒体
US8971647B2 (en) Image compression apparatus, image compression method, and storage medium
JP2011193394A (ja) 画像処理装置、画像処理方法、及びプログラム
JP2004334852A (ja) ピクセルタイプによる画像処理
JP2009296150A (ja) 画像処理装置、画像変換方法、およびコンピュータプログラム
JP2007174522A (ja) 画像処理装置、画像処理方法、プログラムコード及び記憶媒体
JP2008206073A (ja) 画像処理装置、制御方法、プログラム、及び記憶媒体
JPH04356873A (ja) カラー文書画像の適応符号化方式
JP2007088912A (ja) 画像処理装置およびプログラム
JP5757904B2 (ja) 画像圧縮装置
JP4375106B2 (ja) 画像処理装置
JP2008078826A (ja) 画像処理装置及びその制御方法
US8494261B2 (en) Image processing apparatus, image processing method, and computer-readable medium
JPH09167222A (ja) 画像処理装置
JP4757172B2 (ja) 画像符号化装置及びその制御方法
JP4228905B2 (ja) 画像処理装置及びプログラム
JP2006054817A (ja) ドキュメント処理装置

Legal Events

Date Code Title Description
A300 Withdrawal of application because of no request for examination

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20090303