JP3931468B2 - 画像用領域分離装置および方法 - Google Patents

画像用領域分離装置および方法 Download PDF

Info

Publication number
JP3931468B2
JP3931468B2 JP05957099A JP5957099A JP3931468B2 JP 3931468 B2 JP3931468 B2 JP 3931468B2 JP 05957099 A JP05957099 A JP 05957099A JP 5957099 A JP5957099 A JP 5957099A JP 3931468 B2 JP3931468 B2 JP 3931468B2
Authority
JP
Japan
Prior art keywords
image
area
region
determination
output
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP05957099A
Other languages
English (en)
Other versions
JP2000261663A (ja
Inventor
一弘 鈴木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Fujifilm Business Innovation Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd, Fujifilm Business Innovation Corp filed Critical Fuji Xerox Co Ltd
Priority to JP05957099A priority Critical patent/JP3931468B2/ja
Publication of JP2000261663A publication Critical patent/JP2000261663A/ja
Application granted granted Critical
Publication of JP3931468B2 publication Critical patent/JP3931468B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Landscapes

  • Image Processing (AREA)
  • Facsimile Image Signal Circuits (AREA)
  • Color Image Communication Systems (AREA)
  • Compression Of Band Width Or Redundancy In Fax (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、原稿を入力して得られるデジタル画像データに対し、局所ごとの画像の性質を判別して領域を分離する、領域分離方法、及び装置に関する。
【0002】
【従来の技術】
パーソナルコンピュータなどの文書作成環境、デジタルカメラなどの画像の入力装置、フルカラープリンタの普及などにより、写真や図形、文章の混在する文書を個人が容易に作成できる状況にある。
【0003】
このような様々な領域の混在する原稿をスキャナなどで入力して種々の処理を行う場合に、異なる領域に一律の処理を施すことが問題となることが多い。
【0004】
このため、2値化などの階調処理、文字認識、また、画像圧縮等の前処理として、入力原稿を入力して得られる画像データをあらかじめ個別の領域の属性に従って分離する手法が各所で検討されている。
【0005】
例えば、特開平7−231387号公報に開示される手法は、2値化処理のために、線画(文字)、中間調(写真)の領域を識別して適応的な2値化処理を施す手法である。
【0006】
この手法は、従来、入力画像を画素ブロックに分割して最大値と最小値の濃度差や、ブロック内のエッジ密度など、単一の特徴量によって領域分離を行っていたものを、黒画素と最大濃度差という二つの特徴量を用いることで分離精度を改善するものである。
【0007】
また、注目領域の領域判定結果を周辺の領域の判定結果と比較して補正することでさらに分離精度を向上できるとしている。
【0008】
一方、特開平7−236062公報では、原稿を多値領域と2色領域に判別し、これらの領域を、構造化情報を用いて、重なりを許容して画像を再構成するものである。
【0009】
この手法では、例えば画像データを16×16画素のブロックに分割し、各ブロックごとのデータに対して、R、G、Bそれぞれのヒストグラムをとって、それぞれのヒストグラムが2つの山を持つような分布特性を示すブロックは2色領域と判定し2値化した後に2値の符号化方式が適用される。また、ヒストグラムが分散しているようなブロックは多値領域と判定し、多値符号化が適用されるものである。
【0010】
上述した従来技術のように、属性の異なるラスタ領域が混在する原稿を符号化する場合、それぞれの領域に適したアルゴリズムで符号化することが画質、圧縮率の観点から望ましい。
【0011】
画像符号化のアルゴリズムとしては、これまでに、カラー/モノクロの連続調画像を符号化するための標準方式としてJPEG(Joint Photographic Coding Experts Group)が、また、2値画像の標準符号化方式としては、従来からファクシミリに使用されているMH(Modified Huffman)/MR(Modified Read/MMR(Modified MR)などの方式や、JBIG(Joint Bi−level Image Coding Experts Group)などの方式がある。
【0012】
また、連続調画像をより効率的に可逆符号化するためのアルゴリズムや、2値画像を非可逆に符号化するアルゴリズムの標準化も進められている状況にある。
【0013】
一方で、ITU―T(国際電気通信連合、電気通信セクタ)では、文章や写真などの領域の混在するミクストラスター画像を符号化するための標準化が推進され、1997年10月に基本部分の標準化が完了している。
【0014】
この方式では、カラー画像をバックグラウンド、マスク、フォアグラウンドの3レイヤ構成で記述するものである。異なる内容を持つ画像をフォアグラウンドとバックグラウンドのレイヤに記述し、2値のマスクレイヤの情報で切り替える構成である。各レイヤは、それぞれに適した符号化を行うことでより効率的な符号化を実現するものである。
【0015】
しかし、この標準は、主に符号データの構成についての取り決めを行うものであり、実際に領域を分離する手法については、標準の範囲外となっていた。
【0016】
【発明が解決しようとする課題】
以上、説明してきたように従来の領域分離技術においては、後段の特定の処理を想定し、これらの処理に適した形に分離するのが主たる目的とされていた。
【0017】
しかし、現在のようにユーザーが独自の原稿を作成する環境が充実してくると、原稿の多様性や複雑さはますます増大することが考えられる。
【0018】
このため、特定の特徴でなく、いくつかの異なる特徴に着目した方が良好な分離が行えると考えられる。
【0019】
また、分離の際には、標準的なミクストラスタ符号化の符号フォーマットを意識し、二つの画像領域と、これらを選択するためのマスク情報に分離することが必要と考えられる。
【0020】
このため、本発明の画像の領域分離方法、及び装置においては、
▲1▼複数の特徴判別手法による判別結果を求め、原稿を良好に2種類の領域に分離できる特徴に基づいて領域分離する方法、及び装置を提供する、
▲2▼複数の特徴判別手法による2種類の領域への分離を段階的に適用することで、複雑な原稿を階層的に分離するための方法、及び装置を提供する、
ことを課題とした。
【0021】
【課題を解決するための手段】
以上の課題を解決するために、請求項1の発明によれば、画像用領域分離装置に:画像を入力する入力手段と;入力された画像を一時蓄積するための蓄積手段と;前記蓄積された画像の特徴を判別する少なくとも一つの特徴判別手段と;前記特徴判別手段ごとに判別結果を記憶する少なくとも一つの判別結果記憶手段と;前記判別結果記憶手段の少なくとも一つの判別結果に基づいて、前記画像蓄積手段内の画像を2領域に分割する領域情報を出力する領域判定手段と;前記蓄積手段内の画像を読み出し、前記領域判定手段の出力する画素位置ごとの領域情報に従って出力を分離し、領域情報とともに出力する出力選択手段とを設けている。
【0022】
この構成においては、▲1▼複数の特徴判別部を備えることにより、それらの判別結果で最も良好に画像を分離できるものを利用することができ、原稿の特性や後段の処理に応じた領域分離が可能となる。▲2▼また、複数の領域分離を段階的に適用することで、複雑な原稿を詳細に分離することが可能となる。▲3▼さらに、本発明に係る領域分離では、一度の分離により、二つの画像領域と、両者の画素を切り替えるための2値情報を出力するようにしたので、ミクストラスタ符号化の標準フォーマットに好適な分離が行える。
【0023】
また、請求項2の発明は、請求項1の画像用領域分離装置において、前記特徴判別手段が、原稿中のカラーとモノクロの領域を判別することを特徴とする。
【0024】
さらに、請求項3の発明は、請求項1の画像用領域分離装置において、前記特徴判別手段が、原稿中の階調が連続的に変化する領域と階調が急激に変化する領域を判別することを特徴とする。
【0025】
また、請求項4の発明は、請求項1の画像用領域分離装置において、前記特徴判別手段が、原稿中を非可逆に符号化できるかどうかを判別することを特徴とする。
【0026】
また、請求項5の発明は、請求項1の画像用領域分離装置において、前記蓄積手段が、入力された画像を輝度と色差成分から成る色空間、または、明度と色度成分から成る色空間で蓄積することを特徴とする。
【0027】
また、請求項6の発明は、請求項2の画像用領域分離装置において、特徴判別手段が、色空間を構成する各成分のm×n(m,nは正整数)個の画素の矩形領域内の平均値を算出し、これを所定の閾値と比較することでカラーとモノクロの領域を判別することを特徴とする。
【0028】
また、請求項7の発明は、請求項2または請求項6の画像用領域分離装置において、特徴判別手段が、カラーと判別された領域について、色差成分、または、色度情報の値のヒストグラムをとり、これが複数の山を持つ場合には多色領域と判別し、それ以外は連続調のカラー領域であると判別することを特徴とする。
【0029】
また、請求項8の発明は、請求項3の画像用領域分離装置において、特徴判別手段が、色空間を構成する各成分のm×n(m,nは正整数)個の画素の矩形領域内に対し、前記矩形領域内の分散値と、前記分散値によって決まる閾値を用いて計数したヒストグラムの分布と、前記矩形領域内の最大値と最小値に基づいて、前記矩形領域内が文字的な画素分布を持つか写真的な画素分布を持つかを判定することを特徴とする。
【0030】
また、請求項9の発明は、請求項4の画像用領域分離装置において、特徴判別手段が、色空間を構成する各成分のm×n(m,nは正整数)個の画素の矩形領域内に対し、前記矩形領域内の画素に直交変換を施し、所定の量子化閾値で量子化し、前記量子化閾値を用いて逆量子化し、さらに逆直交変換して得られたm×nの矩形領域内の画素を元の矩形領域内の画素と比較し、歪みを所定の閾値と比較することで非可逆に符号化できるか否かを判別することを特徴とする。
【0031】
また、請求項10の発明は、請求項1の画像用領域分離装置において、前記領域判定手段が、前記判別結果記憶手段に記憶される判別結果に対し、周辺の判定結果と異なるものを補正した後、前記判別結果の周辺分布を計数し、判別結果の同じものが大部分を占める矩形領域を決定することを特徴とする。
【0032】
また、請求項11の発明は、請求項1の画像用領域分離装置において、前記出力選択手段が、前記蓄積手段からの画素を読み出し、前記領域判定手段からの領域情報に従って出力先を切り替えて出力する際に、前記領域情報によって選択されなかった出力先にも所定の値を持つ画素を出力することを特徴とする。
【0033】
また、請求項12の発明は、請求項1または2の画像用領域分離装置において、領域判定手段が、前記矩形領域の決定に使用された判定結果を出力した特徴判別手段以外の特徴判別手段によって出力された判定結果の前記矩形領域に該当する部分を読み出し、この判定結果に対して周辺分布を計測し、前記矩形領域内に新たな矩形領域を決定することを特徴とする。
【0034】
また、請求項13の発明によれば、画像用領域分離方法において:画像を入力する入力過程と;入力された画像を一時蓄積するための蓄積過程と;前記蓄積された画像の特徴を判別する少なくとも一つの特徴判別過程と;前記特徴判別過程ごとの判別結果を記憶する少なくとも一つの判別結果記憶過程と;前記判別結果記憶過程の少なくとも一つの判別結果に基づいて、前記画像蓄積過程の画像を2領域に分割するための画素位置ごとの領域情報を出力する領域判定過程と;前記蓄積過程から画像を読み出し、前記領域判定過程の出力する画素位置ごとの領域情報に従って出力を分離し、領域情報とともに出力する出力選過程とを実行するようにしている。
【0035】
この構成においても、原稿の特性や後段の処理に応じた領域分離が可能となり、階層的な領域分離が可能となり、さらに、ミクストラスタ符号化の標準フォーマットに好適な分離が行える。
【0036】
また、請求項14の発明によれば、画像用領域分離装置に:画像を入力する入力手段と;入力された画像を一時蓄積するための蓄積手段と;前記蓄積された画像の特徴を異なる手法で判別する複数の特徴判別手段と;前記複数の特徴判別手段から出力される複数種類の判別結果のうち1種類の判別結果を選択する判別結果選択手段と;選択された前記1種類の判別結果に基づいて、前記画像蓄積手段内の画像を2種類の領域に分割するための領域情報を出力する領域判定手段と;前記蓄積手段内の画像を読み出し、前記領域判定手段が出力する領域情報に従って出力を分離し、領域情報とともに出力する出力選択手段とを設けるようにしている。
【0037】
この構成においても、原稿の特性や後段の処理に応じた領域分離が可能となり、階層的な領域分離が可能となり、さらに、ミクストラスタ符号化の標準フォーマットに好適な分離が行える。
【0038】
また、請求項15の発明は、請求項14の画像用領域分離装置において、前記判別結果選択手段が、最も良好に判別された判別結果を選択することを特徴とする。
【0039】
さらに、請求項16の発明は、請求項14の画像用領域分離装置において、前記判別結果選択手段が、前記蓄積手段から読み出され分離されて出力される画像に対し、後段において実行される処理に基づいて1種類の判別結果を選択することを特徴とする。
【0040】
【発明の実施の形態】
以下、本発明を詳細に説明する。
【0041】
本発明の領域分離は、以下の4つの過程で行われる。
▲1▼画像入力、蓄積過程
▲2▼特徴判別過程
▲3▼領域判定過程
▲4▼出力過程
以下、それぞれの過程について個別に説明する。
【0042】
▲1▼画像入力、蓄積過程
原稿をデジタル画像として入力して一時蓄積する過程である。また、入力時の色空間(例えばRGB)から色変換を施し、輝度、色差成分から成るYCbCr空間や、明度、色度成分から成るL*a*b*空間などで蓄積する。
【0043】
▲2▼特徴判別過程
特徴判別は、画素単位、または、複数画素から構成される小領域ごとに行われ、2値の判別結果が記憶される。
【0044】
また、特徴判別の観点としては、後段の符号化手法の対象画像を考慮して、以下の(1)〜(3)に示す画像の特徴に着目することが考えられる。
(1)カラー(連続調、多色)、モノクロ領域
(2)連続調、文字領域
(3)非可逆に符号化すると劣化が目立つ領域、非可逆でもよい領域
【0045】
▲3▼領域判定過程
特徴判別過程における判別結果から最終的な領域分離に使用する領域情報を決定する。以下の(a)〜(c)の手法が考えられる。
(a)あらかじめ後段の符号化方式が決められている場合、それらの対象画像に分離される判別結果を領域情報とする。
(b)複数の判別結果を比較して、もっとも良好に分離された判別結果を領域情報とする。
(c)複数の判別手法を段階的に適用して階層的に領域情報を決定する。
【0046】
▲4▼出力過程
上記▲3▼の過程で決定された領域情報に基づき、原画像を排他的に分割して二通りの画像出力を得る。さらに画像を再構成する際に、両者を選択するための2値の領域情報を出力する。
【0047】
図9は、画像の再構成について説明する図である。二通りの画像出力と2値の領域情報は、画像蓄積過程に蓄積される画像と同じ解像度を有し、画素位置ごとに2値判断情報に従って二つの画像出力のいずれかの対応する画素を選択し、出力することで画像が再構成される。
【0048】
【実施例】
以下、本発明の実施例について説明する。
<概略説明>
図1に従い、本発明の概略の構成について説明する。図において、100は原稿を読み取りデジタル画像データを出力する画像入力部、200は、前記デジタル画像を一時蓄積する画像蓄積部、300a〜cは、前記画像蓄積部200の画像を読み出して領域を判別するための特徴を計算する特徴判別部、400a〜cは前記判別結果を蓄積する判別結果記憶部、500は、前記判別結果記憶部400a〜cの判別結果にしたがって、領域を選択するための2値情報を決定する領域選択部、600は前記領域選択部500の出力する2値の領域情報に従い、前記画像蓄積部200から読み出した画像データを分離・出力する出力選択部である。
【0049】
続いて、図1に従い、本発明の動作について説明する。
【0050】
原稿は、画像入力部100によって読み込まれ、デジタル化されて明度情報と色度情報という相関性の少ない信号成分に変換される。これにより原稿のモノクロ領域は、明度情報のみで表現することができる。
【0051】
このような明度情報と色度情報からなる色空間としては、CIE(国際照明学会)の定めるCIELAB(L*a*b*空間)や、CIELUV(L*u*v*空間)が知られている。いずれもL*が明度情報であり、他の二つが色度情報である。
【0052】
また、同様に相関性の少ない信号として、輝度成分と色差成分から成るものがある。例えば、テレビジョンの分野においては、YcbCr,YIQ等のように輝度成分(Y)と色差成分(CbとCr、または、IとQ)から成る色空間を用いることによって白黒放送とカラー放送の両立性を維持している。これは先に説明した明度情報と同様に、画像中のモノクロ情報は輝度成分のみを用いて表現できるためである。
【0053】
以下、本発明ではL*a*b*空間を例にとって説明するが、色空間についてはこれに限定するものではなく、以上に述べた他の色空間を用いることも可能である。
【0054】
画像入力部100によって入力された画像信号は、色成分ごとに画像蓄積部200に蓄積される。画像記憶部200の容量としては、原稿全体を蓄積できるものであってもよいし、原稿を複数領域に分割して順次蓄積するようにしてもよい。
【0055】
特徴判別部300a〜cは、画像蓄積部200から画像を画素単位、または、所定の大きさを持つ矩形領域ごとに読み出し、所定の特徴について2値の判別を行い、結果をそれぞれ判別結果記憶部400a〜cに記憶する。なお、判別結果記憶部400a〜cは、画像蓄積部200に蓄積される画素数と同じ数の判定結果が記憶できるものとする。
【0056】
領域決定部500は、判別結果記憶部400a〜cに記憶されている判別結果に基づいて、原稿蓄積部200内の画像を2領域に分離する領域情報を決定する。
【0057】
出力選択部600は、原稿蓄積部200内の画素データを順次読み出し、領域決定部500の決定した領域情報に従って二つの領域を振り分けて第1の領域を含む画像信号700と第2の領域を含む画像信号701の2通りの画像出力を得る。
【0058】
<特徴判別の詳細説明>
以下、特徴判別部300a〜cの構成と動作について詳細に説明する。
(1) カラー/モノクロ領域の判定
カラーモノクロ領域の判定については、例えば、本出願人により特願平5−234915号として出願されている(特開平7−95416号公報)。同出願明細書に開示される領域分析手法では、明度、色度情報で蓄積された画像データを色成分ごとにm×n(m,nは正整数)の矩形領域で読み出し、平均値を算出する。明度情報と色度情報がともに、それぞれに対する所定の閾値以下の場合を背景領域とし、明度情報が所定の閾値以上であり、かつ、色度情報の平均値が所定の閾値以下となるような画素領域をモノクロ領域とし、それ以外をカラーの領域と判別するものである。
【0059】
図2は、上述したカラー・モノクロに関する特徴判別部の構成を示す図である。以下、図に基づいて構成と動作について説明する。
【0060】
図において310,311,312は、画像蓄積部200から色成分ごとに同一の原稿領域に対応するm×nの画素領域を読み出す矩形領域読み出し部、313,314,315は、各色成分の矩形領域ごとに平均値を計算する平均値算出部、316は、各色成分の平均値情報の大小を閾値により判定し、現在処理されているm×nの画素領域がカラーかモノクロ領域か、または背景領域であるかを判定する閾値処理部である。
【0061】
例えば、L*,a*,b*成分のm×nの画素領域の平均値をそれぞれ、μL*,μa*,μb*とし、原稿中の余白領域のL*,a*,b*成分の値をWL*,Wa*,Wb*とすると両者の差が次式を満たす時背景部と判定する。
【0062】
【数1】
|μL*−WL*|≦εL*
|μa*−Wa*|≦εa*
|μb*−Wb*|≦εb*
ただし、εL*,εa*,εb*は使用される用紙に応じて予め設定される閾値である。
【0063】
次に、モノクロ領域の判定法について説明する。背景領域以外と判定され、L*の平均値だけが、背景色と異なる値を持っているかどうかで判定される。
すなわち
【0064】
【数2】
|μL*−WL*|>εL*
|μa*−Wa*|≦εa*
|μb*−Wb*|≦εb*
を満たすような場合はモノクロ領域と判定する。
【0065】
なお、本発明では、カラーの領域が存在する場合は、背景領域とモノクロ領域を統合してカラー領域とそれ以外の2領域に分離する。カラーの領域が存在しない場合は、モノクロ領域と背景領域の2領域に分離するものとする。
【0066】
さらに、上記の判別の間にカラーの領域と判定された領域の色度情報a*とb*のヒストグラムをとることで多色領域か連続調の領域であるかを判別することも可能である。
【0067】
色度情報a*とb*のヒストグラムがいくつかのピークを持つ分布であれば、多色領域と判定することができ、広がりを持つ分布であれば連続調の領域と判定することができる。
【0068】
(2) 連続調/文字領域の判定
連続調/文字領域の判定については、例えば、本出願人により特願平5−128297号として出願されている(特開平6−319133号公報)。
【0069】
同出願明細書に開示される領域分析装置では、はじめに入力されるm×n画素領域の平均値をm×n画素領域内の各画素から減算して、平均値分離ブロックが生成される。つぎにこの平均値分離ブロックの分散、ヒストグラム、及び最大値・最小値を測定する。それぞれの特徴量の大小関係により、画素ブロック内の画素分布が文字的であるか、写真的(連続調)な領域であるかを分析するものである。
【0070】
図3は、上述した連続調・文字に関する特徴判別部の構成を示す図である。以下、図に基づいて構成と動作について説明する。
【0071】
図において320は、画像蓄積部200から特定の色成分のm×nの画素領域を読み出す矩形領域読み出し部、321は、矩形領域内の画素の平均値を計算し、各画素からこれを減じて平均値分離ブロックを出力する平均値計算・分離部、322は、平均値分離ブロックの分散を計算する分散計算部、323は、分散計算部322によって計算された分散に基づく閾値を設定し、閾値で区分される範囲ごとに平均値分離ブロック内の画素値の出現頻度を計数し分布の型を決定するヒストグラム計数部、324は、平均値分離ブロック内の最大値と最小値とを検出する最大値・最小値検出部、325は、分散計算部322、ヒストグラム計数部323、最大値・最小値検出部324がそれぞれ出力する、分散、分布の型、最大値・最小値に基づいて現在処理中のm×nの画素領域が連続調な階調分布であるか文字的な階調分布であるかを判定する判定テーブルである。
【0072】
なお、図においては、明度情報L*が入力となっているが、これは通常の原稿においては文字色として黒が使用されていることが圧倒的に多いと考えられるからである。色文字などが原稿に含まれる場合には、他のa*,b*の色度情報について同様の連続調・文字の特徴判別処理を適用してもよい。
【0073】
(3) 可逆/非可逆の領域の判定
JPEG方式による圧縮は、歪みを伴うものである。このため、原稿内容と、圧縮率の指定によっては復号画像に大きな劣化が発生することがある。
【0074】
例えば、階調変化の緩やかな領域を含む画像では、JPEG方式の処理の単位である8×8画素のブロック境界に画素値の段差が発生することがあり、ブロックノイズと呼ばれている。
【0075】
このため、本発明においては、JPEGアルゴリズムにおいて誤差を発生させる要因であるDCT(離散コサイン変換)と量子化、逆量子化、及び逆DCTを施して得られる復号画素ブロックを元の画素領域との歪みを計算する。これをあらかじめ実験によって求めた閾値と比較することで、非可逆に符号化できるか否かを判定する。
【0076】
図4は、上述した非可逆・可逆に関する特徴判別部の構成を示す図である。以下、図に基づいて構成と動作について説明する。
【0077】
図において330は、画像蓄積部200から特定の色成分の8×8の画素領域を読み出す矩形領域読み出し部、331は、矩形領域内の画素に離散コサイン変換を施して変換係数を得るDCT部、332は前記変換係数を変換係数位置ごとに定められるステップ幅で除算して丸めて量子化係数を得る量子化部、333は、前記量子化係数の各要素に先の量子化処理に用いられたステップ幅を乗じることで変換係数を復元する逆量子化部、334は復元された変換係数に離散コサイン変換の逆変換を施すことで復号画素ブロックを得るIDCT部、335はもとの8×8の画素領域と復号画素ブロックの画素同士の誤差を計算する誤差計算部、336は誤差計算部336の誤差を閾値処理することで、現在処理中の8×8の画素領域が非可逆に符号化できるかを判定する判定テーブルである。
【0078】
JPEG符号化における歪みの発生は、その量子化処理の際のステップ幅に依存している。このため、非可逆・可逆に関するより正確な特徴判別のためには、量子化部332、及び逆量子化部333で使用する量子化のステップ幅を、領域分離後に適用されるJPEG符号化の量子化のステップ幅と同じに設定する必要がある。
【0079】
<領域の決定方法の詳細説明>
特徴判別過程の結果に基づく領域判定の方法について説明する。
【0080】
図5は、領域決定部の構成を示す図である。以下、図に基づいて構成と動作について説明する。
【0081】
図において501は、判別結果記憶部400a〜cのいずれかから判別結果を読み出す判別結果読み出し部、502は、判別結果が周囲と異なる場合に周囲と一致させる孤立点除去部、503は、読み出された判別結果の周辺分布として頻度を計数する周辺分布計数部、504は、周辺分布の計数結果に基づき矩形領域を決定する矩形領域判定部である。
【0082】
以下、図に基づいて動作について説明する。
【0083】
判別結果読み出し部501は、判別結果記憶部400a〜cから判別の単位となったm×n画素領域に対する判別結果を読み出す。以降の処理についてもm×n画素領域を単位として行われる。孤立点除去部502では、周囲8近傍の判定結果と異なる判定結果を反転し、判別結果記憶部400a〜cの該当する部分を修正する。次に、周辺分布計数部503では、判別結果についての周辺分布を計数し、さらに矩形領域判定部504で矩形領域の開始点画素位置、幅、高さを決定する。
【0084】
なお、本発明では画素単位で領域を分離することが可能であるが、画像符号化が近隣画素間の相関の高い性質を利用していることから符号化効率の観点からはあまり細かな領域に分割されない方がよい、また、実際の原稿に写真などが含まれる場合は矩形の領域である場合が多い、などの理由から判別結果を矩形領域としてまとめている。
【0085】
図10に周辺分布の計測法の説明図を示す。
【0086】
周辺分布計数部503では、原稿の横方向(x方向)、縦方向(y方向)にそれぞれ頻度の計数領域を持ち、判別結果として、例えば1が検出されるごとに、縦方向と横方向の対応する位置の頻度の計数値を1ずつ増加する。
【0087】
全判別結果についての集計が終了した時点で、計数値に基づいて矩形領域を決定する。図10の例では、計数値が少ない部分から急激に増加する位置を開始座標(x1、y1)とし、再び急激に減少する位置を終了座標(x2、y2)とみなすことができる。
【0088】
最終的に、矩形領域判定部504より、矩形領域の内外を区別する2値情報が領域情報として出力される。出力の順序は、例えば、画像を最も左上の画素から水平に走査していく順序で、対応する画素ごとに2値の領域情報が出力される。
【0089】
また、領域情報を決定するために使用した特徴判別部を示す識別情報900が出力される。
【0090】
矩形領域判定部504における領域情報の決定については、上述した(a)〜(c)の考え方に基づくことができる。
【0091】
(a)あらかじめ後段の符号化方式が決められている場合、それらの対象画像に分離される判別結果を領域情報とする。
【0092】
例えば、後段に用意される符号化方式が、2値画像を対象としたものであれば、カラー・モノクロ判別は使用されない。連続調と文字領域の判別結果を用いて、適応的な2値化に適した分離を行う。
【0093】
また、後段の符号化方式がJPEGとMH/MR/MMRであれば、連続調と2値の領域に分離するのが望ましいので、文字/連続調領域の判別、または、これにモノクロ/カラー判別を用いて領域を分離する。
【0094】
また、JPEGの必須アルゴリズムであるbaseline systemのような非可逆の方式と、例えばJPEGのIndependent function方式やLZ(Lempel Ziv)方式のような可逆符号化が用意されていれば、非可逆/可逆判別を用いて領域を分離する。
【0095】
(b)複数の判別方法の内、もっとも良好に分離された判別結果を領域情報とする。
【0096】
判別結果が良好であるか否かを判定するためには、例えば、孤立点の数が少ないものを選択する、矩形領域の数が少なくなるべく一かたまりの領域に分離されたものを選ぶ、または、各判別結果を利用者に提示して選択する、などの方法が考えられる。
【0097】
図6は、このような領域決定部の構成を示す図である。以下、図に基づいて構成と動作について説明する。なお、図5と同一の構成については、同一番号を付して説明を省略する。
【0098】
図において、505は孤立点数を計数する孤立点カウンタ、507は検出された矩形領域の数を計数する矩形領域カウンタ、506は孤立点カウンタ505と矩形領域カウンタ507の計数値に基づいて領域分離の成否を判定し、出力選択信号を決定する成否判定部。508は連続して同じ領域情報を発生する固定領域情報発生部。509は、成否判定部506の出力選択信号に従い、領域分離が成功した場合には、矩形領域判定部504の判定結果に基づく領域情報を出力し。また、領域分離が失敗したと判定された場合は、固定領域情報発生部508の出力を領域情報として出力する切り替え部である。
【0099】
原稿によっては、複数の領域分離のいずれもが良好に機能しない場合も考えられる。このような場合、無理に分離して符号化することは、かえって画質や圧縮率の点で問題となることが予想される。上記の判断基準に照らして、または、利用者への提示の結果が、領域分離が良好ではない判断された場合には、以下のように回避する。
【0100】
例えば、モノクロとカラーが混在しているが明確に領域を分離できない場合、全体をモノクロと判別するとカラーの情報が失われてしまうので、全体をカラー領域と判別するように固定領域情報発生部508の出力を決定する。
【0101】
また、モノクロで文字、写真が混在しているが両者の分離が不明瞭な場合は、全体を文字向けに2値かすると写真領域の画質が低下するため、階調を持ったモノクロ画像として出力するようにするように固定領域情報発生部508の出力を決定する。
【0102】
(c)複数の判別手段を段階的に適用して領域情報を決定する。
【0103】
複数の判別結果を使用して領域を段階的に分割することで複雑な領域分離を行うことができる。
【0104】
図7は、このような領域決定部500の構成を示す図である。以下、図に基づいて構成と動作について説明する。なお、この図において、図5、及び図6と同一の構成については、同一番号を付して説明を省略する。図7の構成を、図6の構成と対比すると、矩形領域判定部504aの構成・動作が異なる。
【0105】
図において、矩形領域判定部504aの指示により、判別結果読み出し部501が判別結果記憶部400a〜cの指定された領域の特徴判別結果を読み出し、この領域内で再度矩形領域が構成できるかを判定することで原稿を段階的に領域分離することができる。
【0106】
図11は、原稿を段階的に分離する方法を説明する図である。図において、はじめにカラーとモノクロ領域の分離が行われ、次に、カラー領域を文字と連続調の領域に分離する。さらに連続調の領域内を非可逆・可逆の観点で分離を施す例を表している。
【0107】
図12は、図11の分離の手順を説明するフローチャートである。フローチャートの内容はその記述自体から明瞭であるので説明を行わない。
【0108】
<画像の分割出力の詳細説明>
図8は、出力選択部の構成を説明する図である。以下、図に従って構成と動作について説明する。
【0109】
図において、601は、画像蓄積部200から画素を読み出す画素読み出し部、602は、領域情報にしたがって画素の出力先を切り替える出力切り替え部、603は、ダミー画素を生成するダミー画素生成部、604a,604bは、画素が入力されない場合にダミー画素生成部603と接続するダミー画素出力部、である。
【0110】
以下、図にしたがって動作について説明する。
【0111】
画素読み出し部601は、画像蓄積部200からL*a*b*各8ビットの画素データを読み出す。出力切り替え部では、領域決定部500の出力する2値の領域情報に従って画素データの出力先を切り替える。以後、領域情報が0の場合は、図8の画像出力0の端子に、領域情報が1の場合には、画像出力1の端子に切り替えるものとして説明する。ダミー画素出力部604aでは、領域情報が0、すなわち画像出力0の端子に画素データが出力される場合は、出力切り替え部602からの画素データをそのまま出力し、逆に領域情報が1の場合には、ダミー画素生成部603の出力するダミー画素を画像出力0の端子に出力する。ダミー画素出力部604bの領域情報に対して逆の動作を行う。なお、ダミー画素とは、L*a*b*で白レベルなどに設定する。
【0112】
以上の構成、及び動作により、画像蓄積部200の画像と同じ画素数を持ち、領域情報に従って分離された画像が画像出力0と画像出力1の端子から得られる。画像出力0と画像出力1のいずれか一方に元の画像の画素データが含まれ、他方の対応する画素位置はダミー画素に置き換えられることになる。
【0113】
<実施例の変更形態>
以上の説明においては、分離して出力される画像領域はいずれも画像蓄積部200に蓄積された画像と同じ解像度を有していた。このため、分離された画像を符号化する場合、他方の出力に振り分けられた画素は白レベルとなっており、これについても符号化される必要があった。しかし、例えばJPEG符号化では、余白(白レベルの連続)領域を符号化しても符号量が零にならないので、符号化効率の点では問題があった。
【0114】
そこで、領域決定部500で決定された2領域の内、矩形領域を構成するものについては、開始座標(画素位置)と領域の幅、高さを直接出力し、出力選択部600の出力も矩形領域内の画素だけにすることで、符号化の際に無駄な領域を省くことができる。
【0115】
また、出力選択部600において、領域情報に対応して分離される画像に予め処理を加えてもよい。このような処理としては、例えば、モノクロとカラーに分離された場合、モノクロ領域についてはL*成分(8ビット)のみを出力し、カラーの領域のみL*a*b*の24ビットを出力するようにしてもよい。また、モノクロの文字領域領については2値化処理を、カラーの文字領域と判定された場合には、多色化処理を施してもよい。カラーの写真領域と判定された場合は、解像度が低下しても画質を維持できる場合がある。このため、色度情報a*,b*、あるいは全成分に対して解像度変換(間引き)を施し、縮小率を合わせて出力してもよい。
【0116】
画像蓄積部200に蓄積する画像は、必ずしも原稿全体である必要はない。例えば、原稿を走査して得られる画像データを複数走査線分ずつに上記の領域分離処理を行ってもよい。
【0117】
【発明の効果】
以上、述べてきたように、本発明の画像用領域分離方法、及び装置によれば、▲1▼複数の特徴判別部を備えたことにより、それらの判別結果で最も良好に画像を分離できる特徴を採用するようにしたので、原稿の特性に応じた領域分離が可能となる。
▲2▼また、複数の領域分離を段階的に適用することで、複雑な原稿を詳細に分離することが可能となる。
▲3▼さらに、本発明に係る領域分離では、一度の分離により、二つの画像領域と、両者の画素を切り替えるための2値情報を出力するようにしたので、ミクストラスタ符号化の標準フォーマットに好適な分離が行える。
【図面の簡単な説明】
【図1】 本発明の実施例の概略構成を示すブロック図である。
【図2】 実施例のカラー・モノクロに関する特徴判別部300の構成例を示すブロック図である。
【図3】 実施例の連続調・文字に関する特徴判別部300の構成例を示すブロック図である。
【図4】 実施例の非可逆・可逆に関する特徴判別部300の構成例を示すブロック図である。
【図5】 実施例の領域決定部500の構成例を示すブロック図である。
【図6】 実施例の領域決定部500の他の構成例を示すブロック図である。
【図7】 実施例の領域決定部500の他の構成例を示すブロック図である。
【図8】 実施例の出力選択部600の構成例を示すブロック図である。
【図9】 画像の再構成を説明する図である。
【図10】 周辺分布による領域の決定を説明する図である。
【図11】 段階的な領域判定の説明図である。
【図12】 段階的な領域判定のフローチャートである。
【符号の説明】
100 画像入力部
200 画像蓄積部
300a,b,c 特徴判別部
400a,b,c 判別結果記憶部
500 領域決定部
600 出力選択部
700 分割された第1の領域を含む画像信号
701 分割された第2の領域を含む画像信号
800 領域情報
900 特徴判別部を識別する識別情報
310,311,312 矩形領域読み出し部
313,314,315 平均値算出部
316 閾値処理
320 矩形領域読み出し部
321 平均値計算・分離部
322 分散計算部
323 ヒストグラム計数部
324 最大値・最小値検出部
325 判定テーブル
331 DCT部
332 量子化部
333 逆量子化部
334 IDCT部
335 誤差計算部
336 閾値処理部
501 判定結果読み出し部
502 孤立点除去部
503 周辺分布計数部
504 矩形領域判定部
505 孤立点カウンタ
506 矩形領域カウンタ
507 成否判定部
508 固定領域情報発生部
509 切り替え部
601 画素読み出し部
602 出力先切り替え部
603 ダミー画素生成部
604a,b ダミー画素出力部

Claims (12)

  1. 画像を入力する入力手段と、
    入力された画像を一時蓄積するための画像蓄積手段と、
    前記蓄積された画像の特徴を異なる手法で判別する複数の特徴判別手段と、
    前記複数の特徴判別手段から出力される複数種類の判別結果のうち、孤立点の数が少ない判定結果を選択するという選択基準、または矩形領域が少ない判定結果を選択するという選択基準により、1種類の判別結果を選択する判別結果選択手段と、
    選択された前記1種類の判別結果に基づいて、前記画像蓄積手段内の画像を2種類の領域に分割するための領域情報を出力する領域判定手段と、
    前記蓄積手段内の画像を読み出し、前記領域判定手段が出力する領域情報に従って出力を分離し、領域情報とともに出力する出力選択手段とを有することを特徴とする画像用領域分離装置。
  2. 前記特徴判別手段の一つは、原稿中のカラーの領域とモノクロの領域とを判別する請求項1に記載の画像用領域分離装置。
  3. 前記特徴判別手段の一つは、原稿中の階調が連続的に変化する領域と階調が急激に変化する領域を判別する請求項1または2に記載の画像用領域分離装置。
  4. 前記特徴判別手段の一つは、原稿中を非可逆に符号化できるかどうかを判別する請求項1〜3のいずれかに記載の画像用領域分離装置。
  5. 前記蓄積手段は、入力された画像を輝度成分と色差成分とから成る色空間、または、明度成分と色度成分とから成る色空間で蓄積する請求項1に記載の画像用領域分離装置。
  6. 前記特徴判別手段の一つは、色空間を構成する各成分のm×n(m,nは正整数)個の画素の矩形領域内の平均値を算出し、これを所定の閾値と比較することでカラーの領域とモノクロの領域とを判別する請求項2に記載の画像用領域分離装置。
  7. 前記特徴判別手段の一つは、カラーと判別された領域について、色差成分、または、色度情報の値のヒストグラムをとり、これが複数の山を持つ場合には多色領域と判別し、それ以外は連続調のカラー領域であると判別する請求項2または6に記載の画像用領域分離装置。
  8. 前記特徴判別手段の一つは、色空間を構成する各成分のm×n(m,nは正整数)個の画素の矩形領域内に対し、前記矩形領域内の分散値と、前記分散値によって決まる閾値を用いて計数したヒストグラムの分布と、前記矩形領域内の最大値と最小値とに基づいて、前記矩形領域内が文字的な画素分布を持つか写真的な画素分布を持つかを判定する請求項3に記載の画像用領域分離装置。
  9. 前記特徴判別手段の一つは、色空間を構成する各成分のm×n(m,nは正整数)個の画素の矩形領域内に対し、前記矩形領域内の画素に直交変換を施し、所定の量子化閾値で量子化し、前記量子化閾値を用いて逆量子化し、さらに逆直交変換して得られたm×nの矩形領域内の画素を元の矩形領域内の画素と比較し、歪みを所定の閾値と比較することで非可逆に符号化できるか否かを判別する請求項4に記載の画像用領域分離装置。
  10. 前記領域判定手段は、前記判別結果記憶手段に記憶される判別結果に対し、周辺の判定結果と異なるものを補正した後、前記判別結果の周辺分布を計数し、判別結果の同じものが大部分を占める矩形領域を決定する請求項1に記載の画像用領域分離装置。
  11. 前記出力選択手段は、前記蓄積手段から画素を読み出し、前記領域判定手段からの領域情報に従って出力先を切り替えて出力する際に、前記領域情報によって選択されなかった出力先にも所定の値を持つ画素を出力する請求項1に記載の画像用領域分離装置。
  12. 画像を入力する入力ステップと、
    入力された画像を画像蓄積手段に一時蓄積するための蓄積ステップと、
    前記蓄積された画像の特徴を異なる手法で判別する複数の特徴判別ステップと、
    前記複数の特徴判別ステップにより出力される複数種類の判別結果のうち、孤立点の数が少ない判定結果を選択するという選択基準、または矩形領域が少ない判定結果を選択するという選択基準により、1種類の判別結果を選択する判別結果選択ステップと、
    選択された前記1種類の判別結果に基づいて、前記画像蓄積手段内の画像を2種類の領域に分割するための領域情報を出力する領域判定ステップと、
    前記蓄積手段内の画像を読み出し、前記領域判定ステップにより出力される領域情報に従って出力を分離し、領域情報とともに出力する出力選択ステップとを有することを特徴とする画像用領域分離方法。
JP05957099A 1999-03-08 1999-03-08 画像用領域分離装置および方法 Expired - Lifetime JP3931468B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP05957099A JP3931468B2 (ja) 1999-03-08 1999-03-08 画像用領域分離装置および方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP05957099A JP3931468B2 (ja) 1999-03-08 1999-03-08 画像用領域分離装置および方法

Publications (2)

Publication Number Publication Date
JP2000261663A JP2000261663A (ja) 2000-09-22
JP3931468B2 true JP3931468B2 (ja) 2007-06-13

Family

ID=13117039

Family Applications (1)

Application Number Title Priority Date Filing Date
JP05957099A Expired - Lifetime JP3931468B2 (ja) 1999-03-08 1999-03-08 画像用領域分離装置および方法

Country Status (1)

Country Link
JP (1) JP3931468B2 (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1388815A3 (en) * 2002-04-25 2005-11-16 Microsoft Corporation Segmented layered image system
JP2006166355A (ja) * 2004-12-10 2006-06-22 Ricoh Co Ltd 画像処理装置、画像処理方法、画像処理プログラム及び記録媒体
JP4930423B2 (ja) * 2008-03-19 2012-05-16 コニカミノルタビジネステクノロジーズ株式会社 画像処理装置、画像形成装置、画像処理装置の制御方法、および画像処理装置の制御プログラム
JP4526577B2 (ja) * 2008-04-11 2010-08-18 株式会社リコー 画像処理装置および画像処理システムおよび画像処理方法

Also Published As

Publication number Publication date
JP2000261663A (ja) 2000-09-22

Similar Documents

Publication Publication Date Title
JP2720924B2 (ja) 画像信号の符号化装置
US6701012B1 (en) Out-of-layer pixel generation for a decomposed-image layer
JP4295882B2 (ja) デジタル画像データの区分方法並びにデータブロックの区分方法及び分類方法
JP4242532B2 (ja) デジタル画像データ区分方法
US6633670B1 (en) Mask generation for multi-layer image decomposition
US5905579A (en) Image processing method and apparatus which separates an input image into character and non-character areas
JP2621747B2 (ja) 画像処理装置
US5535013A (en) Image data compression and expansion apparatus, and image area discrimination processing apparatus therefor
US6334001B2 (en) Iterative smoothing technique for pre-processing mixed raster content planes to improve the quality of a decompressed image and increase document compression ratios
JP4115460B2 (ja) 画像処理装置およびその方法、並びに、コンピュータプログラムおよび記録媒体
JP3176052B2 (ja) 画像処理装置
US20020064307A1 (en) Image processing apparatus and method
US6486981B1 (en) Color image processing method and apparatus thereof
JP2000175052A (ja) ピクセルマップ表現の処理方法及び装置
JP2001268372A (ja) 圧縮されたドキュメント画像内にエイリアス除去テキスト及びライングラフィックスを生成する方法
JP3117091B2 (ja) 画像符号化装置
JP2004537220A (ja) ディジタル画像を処理する装置
US7065254B2 (en) Multilayered image file
US6272251B1 (en) Fully automatic pasting of images into compressed pre-collated documents
JP3931468B2 (ja) 画像用領域分離装置および方法
US6826309B2 (en) Prefiltering for segmented image compression
EP1006714A2 (en) Method of processing mixed raster content planes
JP3595601B2 (ja) 画像通信方法及びその装置
JP3327684B2 (ja) カラー画像処理方法及びその装置
JPH08298589A (ja) 写真・文書混在画像の画像処理装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20031209

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20060623

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060718

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060912

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20070220

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20070305

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110323

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120323

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130323

Year of fee payment: 6