JP3108133B2 - カラー文書画像の適応符号化方式 - Google Patents

カラー文書画像の適応符号化方式

Info

Publication number
JP3108133B2
JP3108133B2 JP03164377A JP16437791A JP3108133B2 JP 3108133 B2 JP3108133 B2 JP 3108133B2 JP 03164377 A JP03164377 A JP 03164377A JP 16437791 A JP16437791 A JP 16437791A JP 3108133 B2 JP3108133 B2 JP 3108133B2
Authority
JP
Japan
Prior art keywords
area
character
block
background
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP03164377A
Other languages
English (en)
Other versions
JPH04356873A (ja
Inventor
寿夫 白沢
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP03164377A priority Critical patent/JP3108133B2/ja
Publication of JPH04356873A publication Critical patent/JPH04356873A/ja
Priority to US08/300,846 priority patent/US5696842A/en
Application granted granted Critical
Publication of JP3108133B2 publication Critical patent/JP3108133B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Image Processing (AREA)
  • Facsimile Image Signal Circuits (AREA)

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】この発明は文字と絵柄とが混在す
るカラー文書画像の適応符号化方式に関し、電子ファイ
リングシステム、カラーファクシミリ、カラーコピー等
の各種カラー文書画像用の入出力装置に適用して好適な
ものである。
【0002】
【従来の技術】近年、文字と絵柄とが混在するカラー文
書画像に対する符号化方式の研究が活発化している。こ
のような符号化方式が必要とされるのは、カラー文書画
像は従来のモノクロ文書画像に比べてデータ量が多いた
め、スキャナ等の画像入力装置から画像データを取り込
んでデータベースを構築する場合、データ量を削減する
ための効率よい圧縮処理が不可欠になるためである。ま
た、自然画像符号化方式として高域成分をカットする帯
域圧縮法を用いたADCT(Adaptive DiscreteCosine
Transform)方式が標準化方式として採用されると、文
字のようなエッジ部分ではモスキートノイズが生じて画
質劣化が目立つからである。文字のように分解能が重要
となる画像には可逆エントロピー符号を用い、自然画像
のように階調性が重要となる画像には帯域圧縮のような
非可逆で多値の符号化方式を用いた方が適している。
【0003】そこで、原画像から文字のエッジ成分を抽
出し、エッジ成分に対しては動的算術符号を用いて符号
化し、原画像からエッジ成分を除去した残りの成分に対
してはADCTを用いて符号化する『文字・画像混在文
書の一符号化方式』(平成2年度画像電子学会全国大会
予稿集,P131 〜P136 )が提案されている。
【0004】この方式は、まず文字のエッジ成分を抽出
し、その成分を2値化することによって文字パターンを
生成して算術符号化を行う。次いで、抽出した文字パタ
ーンの部分の濃度を周辺の下地部分の濃度の平均値で置
き換えて原画像からエッジ成分を除去した画像を生成
し、この画像をADCTによって符号化する。
【0005】このようにエッジ成分を分離して適応的に
符号化するのは、前述したようにADCT方式は自然画
像向けの画像圧縮方式であり、基本的には高域成分をカ
ットする方式であるため、文字のような画像に適用する
には圧縮率を下げて高域成分のカット量を減らさなけれ
ばエッジ周辺の画質が劣化してしまうからである。エッ
ジ成分を分離したのち2値化し可逆の符号化を行えば、
エッジ部分の高域成分を除去した画像にADCTを施す
ことになるので、全体として同じ符号量でも画質を向上
させることができる。
【0006】
【発明が解決しようとする課題】ところで、前述の従来
方式では、カラー文書画像の描かれている紙面の地肌部
分も自然画像の一部とみなしてADCT方式を適用して
いる。しかし、カラー文書画像に使用される白地原稿を
考えた場合、地肌部分には意図的な情報は含まれておら
ず、イメージスキャナで読み取った際の濃度ムラは使用
した紙の品質に起因している。
【0007】従って、このような地肌部分に対しては入
力時の階調を忠実に再現するよりも、むしろ一定濃度で
置き換えた方が濃度ムラがなくなり画像品質が向上す
る。また、符号化効率の面からも地肌を自然画像とみな
して符号化するよりも一定濃度値で置き換えた方がかな
り効率が良くなる。そこで、この発明では、文字の他に
地肌部分も抽出することによって前述の従来方式に比
べ、高圧縮かつ高画質な符号化を行うことを目的とす
る。
【0008】また、この発明は、自然画像にはそれほど
高い解像度は必要としないことが多い点に着目し、絵柄
領域の解像度を低くして符号化することにより高圧縮な
符号化を行うことを目的とする。さらに、この発明は、
原画像から文字パターンを取り除いた絵柄領域のうちで
も自然画領域と背景領域とではその特性が大きく異なる
点に着目し、自然画領域と背景領域とで符号化方式を異
ならせることで高圧縮な符号化を行うことを目的とす
る。
【0009】
【課題を解決するための手段】この発明によるカラー文
書画像の適応符号化方式は、階調性を有する自然画像と
文字とが混在するカラー文書画像を、M×N画素のブロ
ック単位で文字・地肌領域または絵柄領域の何れである
かを判定し、この判定結果に基づき、文字・地肌領域と
判定したブロックの画像データは2値画像に適した符号
化を行い、絵柄領域と判定したブロックの画像データは
絵柄領域に適した符号化を行うことを特徴とする。
【0010】
【作用】この発明によるカラー文書画像の適応符号化方
式においては、文字以外に地肌領域も抽出し、文字・地
肌領域は2値画像として符号化し、残りの絵柄領域は自
然画像符号化を行う。このため、地肌領域を絵柄領域と
していた従来の方式に比べ、文字が鮮明に再生され、地
肌も濃度ムラがなくなり高画質な画像となる。
【0011】
【実施例】図1は、この発明によるカラー文書画像の適
応符号化方式の一実施例を示すブロック図である。図1
において、スキャナ1は対象となるカラー文書画像を読
み取るもので、文字を読み取る必要性から、例えば、4
00dpi 程度の解像度を有している。このスキャナ1か
ら出力される画像データは3原色RGBの3種類の画像
データで、データ値は各色256階調、白画素は〔R,
G,B〕=〔0,0,0〕、黒画素は〔R,G,B〕=
〔 256, 256,256 〕となっている。
【0012】スキャナ1から出力される画像データはラ
スタースキャンの順に出力され、数ライン分の画像デー
タを蓄積するバッファ2に一旦格納される。バッファ2
に格納された画像データは、ブロック毎に像域分離部3
に出力され、当該ブロックが文字・地肌ブロックか絵柄
(写真,網点,ベタ等)ブロックか判定される。1ブロ
ックはADCT方式に合わせて8×8画素または16×
16画素からなっている。像域分離部3の構成および判
定動作については後述する。
【0013】なお、ここでいう文字とは印刷文字程度に
黒い文字で、鉛筆書きのように薄い文字や色文字は絵柄
とする。また、地肌とはコピー用紙程度に白い紙の地肌
で、新聞紙のような輝度の低い地肌は含めない。また、
写真や網点のハイライト部は絵柄とし地肌に含めない。
【0014】スイッチ部4では、像域分離部3での判定
結果に基づいて当該ブロックが文字・地肌ブロックであ
れば画像データを2値画像符号化部5に供給し、当該ブ
ロックが絵柄ブロックであれば自然画像符号化部6に供
給する。従って、自然画像符号化は絵柄領域にしか行わ
ないので、絵柄領域の少ない画像に対しては大幅に圧縮
率を上げることができる。
【0015】2値画像符号化部5では、供給される文字
・地肌ブロックの画像データを所定の閾値により2値化
して2値画像符号化を行う。2値化の際には閾値によっ
て文字の太さが変わるのを防ぐために、エッジ強調を施
したデータに対して行う。また、2値領域はブロック単
位で与えられるため、各ブロック毎にラスタースキャン
して1次元のデータ系列に変換し、ハフマン符号や算術
符号等のエントロピー符号化を施す。なお、スキャン方
式の詳細については後述する。
【0016】自然画像符号化部6では、文字・地肌ブロ
ック以外のブロックを絵柄領域として自然画像用の符号
化を行う。絵柄領域には網点領域も含まれているため平
滑化を行い、網点の形状を除去してからADCTのよう
な直交変換符号化を行う。予め網点の形状を除去する理
由は、もともと網点は少ない階調で見かけ上の階調性を
向上させるために行われているので(ただし、低線数の
網点の中には例外もある)、網点の形状をそのまま残す
必要がないということ、ADCTは網点画像に対して圧
縮効率が非常に悪いことなどによる。
【0017】領域情報符号化部7では、像域分離回路3
で判定した領域に関する情報を領域情報として符号化す
る。この領域情報はブロック単位の情報であり、しかも
文字・地肌領域かそれ以外の領域かの2値情報であり、
データ量はかなり小さい。単純に文字・地肌と同じよう
な自己相関を持っていたとしてもデータ量は約1/256に
なる。領域情報も2値であることから文字・地肌領域と
同様にエントロピー符号化を行う。
【0018】こうして各符号化部5〜7で符号化された
各データはフォーマット部8でアプリケーションに適し
たフォーマットに変換された後、外部記憶装置9に記憶
される。
【0019】次に、図2に示すブロック図を参照して像
域分離部3について説明する。像域分離部3はバッファ
2から供給されるブロック毎の画像データをMTF(Mo
dulation Transfer Function)補正部10および白地抽
出部11に供給する。MTF補正部10では、画像デー
タをMTF補正して2値化し、解像度を重視したデータ
としてエッジ抽出部12に出力する。
【0020】白地抽出部11では、バッファ2から供給
されるブロック毎の画像データを、画素単位に白地か否
か判定して白地領域を抽出する。単純に濃度情報を用い
て画素単位に白地か否か判定するが、地肌領域自体の濃
度ムラのために地肌領域中に多くの非白地画素が残って
しまうので、ブロック単位の膨張処理を行う。地肌中の
非白地画像はランダムなパターンで生じると思われるの
で、ブロック中の白地画素の画素数で判定する。例え
ば、ブロックサイズが16×16画素の場合、約80%
が白画素であればそのブロック全てを白地ブロックとす
る。ただし、写真領域を白地と誤判定しないようにブロ
ック中に一画素でも色画素がある場合は絵柄ブロックと
する。しかし、これらの処理では、まだ写真中の白い部
分や網点中のハイライト部分が白地と判定されるので、
網点領域を地肌と誤判定するのを防ぐために網点検出を
行う。白地ブロックで網点と判定された領域が存在する
場合には、そのブロックは絵柄ブロックに変更する。こ
れらの処理によって白地領域を抽出する。
【0021】エッジ抽出部12では、文字のエッジを分
離する。画素単位のエッジ抽出だけでは誤分離が多いた
め、基本的にブロック単位で判定する。この判定法に
は、単純にエッジ画素数だけで判定する方法も考えられ
るが、抽出精度をあげるためにエッジ画素の形状パター
ンにより抽出する。この理由は、一般に文字エッジは連
続性を持っているからである。形状パターンとしては
縦、横、斜め方向に連続するパターンをブロックのサイ
ズに応じて用意しておく。最近、DTP(デスク・トッ
プ・パブリッシング)に多くみられる大きな文字の内部
の黒ベタ領域は黒ベタと精度よく分離することが難しい
ので絵柄領域として取り扱う。
【0022】総合判定部13では、白地抽出部11およ
びエッジ抽出部12における判定結果に基づいて、得ら
れたエッジ領域と白地領域とを併せて文字・地肌領域と
判定する。ただし、符号化が16×16画素ブロックを
単位とするため、文字・地肌領域はこのサイズのブロッ
ク単位で判定する。判定はエッジまたは白地ブロックが
有れば文字・地肌領域とする。ただし、ブロック中の文
字でも白地でもない領域に色画素が存在するならば絵柄
領域とする。最後に、写真中の絵柄ブロックで囲まれた
白地ブロックを絵柄ブロックに変更するため全体的に絵
柄ブロックを上下左右に1ブロック分膨張させる。
【0023】図3は、像域分離部3の他の実施例を示す
ブロック図である。この実施例においては、バッファ2
から供給される画像データを、黒文字抽出部20および
白画素抽出部21にそれぞれ供給し、黒文字抽出および
白画素抽出を行う。黒文字抽出部20は文字として黒文
字を抽出する。ただし、大きな文字内部の黒ベタ領域は
絵柄部の黒ベタと精度よく分離することが難しいので、
絵柄領域として扱う。黒文字抽出のアルゴリズムとして
は、例えば、本出願人が先に提出した「カラー画像処理
装置」(特願平2−214140号)による像域分離方
式を用いる。この場合、文字周辺では白地の濃度レベル
があがっていると予想されるため、文字領域の膨張を行
い、周辺の地肌を含めて文字領域としておく。この処理
は文字と白地との間に絵柄領域が生じるのを防ぐもので
ある。抽出結果は2値論理で文字領域は「1」、非文字
領域は「0」としてバッファメモリ22に記憶する。
【0024】白画素抽出部21は各画素のG(緑)成分
の濃度レベルが閾値Th以上なら非白画素、閾値Th未
満なら白画素とする。一般に原稿の地肌濃度をコピー用
紙の濃度以下に限定した場合、すなわち、新聞や低品質
の印刷原稿の地肌を地肌領域として検出しない場合、絵
柄(写真や網点)中のハイライト領域の濃度レベルは原
稿の地肌そのものの領域の濃度レベルよりも高くなるこ
とが多い。そのため、このように単純な閾値で画素単位
に判定しても地肌領域では白画素が密集し、ハイライト
領域ではまばらにしか白画素が分布しないといった特徴
の差が生じる。抽出結果は白画素は論理「1」、非白画
素は論理「0」としてバッファメモリ23に記憶する。
【0025】バッファメモリ22および23に記憶した
黒文字抽出部20および白画素抽出部21の抽出結果
は、オア回路24で論理和を取りバッファメモリ25に
記憶する。論理和の結果が画素単位で論理「1」ならば
文字・地肌領域、論理「0」ならば絵柄領域となる。
【0026】ところで、自然静止画像の符号化方式であ
るADCT方式では、一般に8×8画素または16×1
6画素を1ブロックとしてブロック単位で符号化を行っ
ているため、文字・地肌領域の判定もこのような符号化
方式に適したブロックサイズで判定しなければならな
い。そこで、総合判定部26では、バッファメモリ25
に記憶した画素データを、例えば16×16画素単位で
読み出し、ブロック単位で文字・地肌領域か絵柄領域か
を判定する。判定はブロック内の黒文字および白画素の
数を用いる。先に述べたようにハイライト領域では白画
素がまばらに分布し、地肌領域では白画素が密集する。
そこで、ハイライト領域を文字・地肌領域と誤判定しな
いようにブロック内に含まれる黒文字および白画素の数
を閾値と定め(約180〜230画素)、黒文字および
白画素の数を閾値以上含まれるブロックを文字・地肌ブ
ロックとする。最後に絵柄部での誤分離を防ぐために絵
柄ブロックに囲まれた文字・地肌ブロックを絵柄ブロッ
クに変更する。以上の処理により文字・地肌領域が抽出
できる。
【0027】次に、図4(a) 〜(c) を参照してバッファ
2にブロック単位で格納された画像データを符号化する
際のスキャン方式について説明する。図4(a) に示すス
キャン方式は画素データを1ブロック毎にスキャンして
符号化する方式である。この方式は、文字・地肌ブロッ
クについては当該ブロック内でラスタースキャンしなが
ら符号化し、絵柄ブロックについてはADCTのような
ブロック符号化を施す。この方式はブロック単位での処
理が可能なのでメモリ容量が少なくて済むが、動的算術
符号などのように参照画素を必要とする場合には実施で
きない。
【0028】図4(b) に示すスキャン方式は連続する同
一属性ブロック単位に符号化する方式である。この方式
は、文字・地肌ブロックについては行方向に連続する複
数ブロックをひとまとめにしてラスタースキャンの順に
符号化し、絵柄ブロックについては図(a) の場合と同様
に1ブロック毎に符号化する。従って、1度に処理する
ブロック数は可変となる。この方式で動的算術符号のよ
うに参照画素を用いる場合は絵柄ブロックの画素は
「0」または「1」の一方の値を用いる。
【0029】図4(c) に示すスキャン方式は1ブロック
行単位に符号化する方式である。この方式は文字・地肌
ブロックについてはブロック行毎にラスタースキャンの
順に符号化し、絵柄ブロックの画素はジャンプして符号
化しない。絵柄ブロックについては図(a) の場合と同様
に1ブロック毎に符号化する。この方式で動的算術符号
を用いる場合は図(b) の場合と同様に絵柄ブロックの画
素は「0」または「1」の一方の値を用いる。
【0030】次に、図5に示すブロック図を参照して図
4(c) に示すスキャン方式を適用した場合の2値画像符
号化部5について説明する。図5において、スイッチ部
4(図1)から供給される画像データは、MTF補正部
30でMTF補正され、2値化回路31で所定の閾値と
比較されて2値化され、ラインバッファメモリ32に格
納される。
【0031】ラインバッファメモリ32は、像域分離部
3での判定の結果、画像データが文字・地肌領域のデー
タであれば2値化回路31で2値化したデータを対応す
るアドレスに書き込み、絵柄領域のデータであれば論理
「1」を書き込む。この書き込み制御はアドレスコント
ローラ33によって行われる。
【0032】ラインバッファメモリ32に1ブロック行
分のデータが書き込まれると、アドレスコントローラ3
3の制御のもとにメモリ32から注目画素と参照画素の
データとが読み出され、符号化部34に供給されて符号
化される。参照画素の抽出には、図6に示すようなテン
プレートを用いる。また、符号化部34としては、JB
IGによるQM−Coder符号化部を用いる。
【0033】ラインバッファメモリ32について更に詳
述すると、このメモリは1画素1ビットで2ブロック行
分のデータが格納でき、パイプラインの動作が可能なよ
うに構成されている。例えば、1ブロック行が横160
0画素、縦16画素の場合には1604×16ビットの
ラインバッファメモリが2組必要になる。横に4画素分
多いのは、参照画素を計算するための予備領域として左
右2画素分持っているためである。この2組のラインバ
ッファメモリをそれぞれBa,Bbとすると、処理の開
始時には全てのバッファメモリの値を「0」にセットす
る。そして、最初の書き込みデータが入力されるとバッ
ファメモリBbの(2,0)の位置から順にラスター方
向に書き込んで行く。バッファメモリBbに全てのデー
タが書き込まれると、今度はラインバッファメモリBa
にデータを書き込み、参照画素および注目画素をバッフ
ァメモリBbから読み出す。ただし、第1,第2ライン
の1つおよび2つ前のラインの参照画素としては、バッ
ファメモリBaの15,16ラインの値を用いる。例え
ば、バッファメモリBbの(2,0)を注目画素とする
ときの参照画素の位置は、バッファメモリBbの(0,
0)、(1,0)とバッファメモリBaの(0,1
5)、(1,15)、(2,15)、(3,15)、
(4,15)、(1,14)、(2,14)、(3,1
4)となる。
【0034】次に、図7を参照してこの発明の他の符号
化方式について説明する。この方式は絵柄領域の解像度
を低くして符号化する方式である。すなわち、カラー文
書画像をスキャナで読み取る場合、現在の技術では一文
書の全面を同じ解像度でしか読み取ることが出来ないた
め、一般には小さな文字が読み取れるように400dpi
以上の解像度が必要になってくる。しかし、自然画像に
はそれほど高い解像度は必要としないことが多い。とこ
ろが、これまでは絵柄領域に対して入力時の解像度のま
まで符号化を行っている。これは、自然画像符号化方式
として用いているADCT方式では、8×8画素または
16×16画素を最小のブロックサイズとしているた
め、絵柄領域の解像度変換を行おうとすると像域分離の
判定のためにブロックサイズを大きくしなければならな
くなり、バッファメモリの容量が大きくなってしまうか
らである。
【0035】そこで、この方式では、像域分離の判定ブ
ロックサイズを大きくせずに絵柄領域の解像度を低くし
て符号化するようにしている。図7の例では、絵柄領域
の必要解像度を100dpi 、文字・地肌領域を400dp
i として符号化している。従って、絵柄領域は縦横それ
ぞれ4分の1に縮小されることになる。すなわち、8×
8画素を1ブロックとすると、絵柄領域1ブロック当た
りで符号化を行う画素数は2×2画素の計4画素とな
り、データ量は16分の1に圧縮される。縮小処理は単
純に平滑化処理で行う。符号化は絵柄領域に対してはD
PCMのような可逆かつ画素単位の符号化を用いる。文
字・地肌領域に対しては動的算術符号のような2値画像
符号化を用いる。いずれも周辺画素を参照する方式であ
ることから1ブロック行毎に行う。
【0036】図7において、実線で囲んだ正方形の部分
が1ブロックを表している。絵柄ブロックは平滑化によ
り破線で示すように1ブロック4画素に縮小されてい
る。絵柄ブロックの符号化は画素a11,a12,b11,b
12,…の順に行い、最右端の画素を符号化すると次のラ
インの符号化を始め、画素a21,a22,b21,b22,…
の順に符号化する。注目画素値の予測に周辺画素を用い
る場合は、周辺画素が文字・地肌領域に属する場合は文
字・地肌領域に含まれる画素値を「0」とみなして注目
画素を予測し符号化する。文字・地肌領域の符号化は図
に矢印で示すように、1画素単位でラスタースキャンの
順に符号化する。符号化方式として動的算術符号化のよ
うに参照画素を用いる場合は、絵柄領域に含まれる画素
値を「0」とみなして注目画素を予測し符号化する。
【0037】この方式によれば、絵柄領域の画像に対し
て適切な解像度で符号化を行っているので、原画像デー
タのままで符号化するよりも高い圧縮率が可能となる。
【0038】次に、図8に示すブロック図を参照して自
然画像符号化部6の他の実施例について説明する。この
実施例では、入力画像から文字パターンを取り除いた絵
柄領域のうちでも自然画領域と背景領域とではその特性
が大きく異なる点に着目し、自然画領域と背景領域とで
符号化方式を異ならせることでより高い符号化効率を得
るようにしている。すなわち、自然画領域は色の変化や
テクスチャーを含んでいるため、直交変換の結果、DC
(直流)成分以外の低周波成分が比較的多く現れる。こ
れに対して背景領域では局所的に見てほぼ濃度が一定で
あるため、空間周波数領域では殆どDC成分のみとなっ
てしまう。
【0039】そこで、この実施例では、入力画像から文
字パターンを取り除いた残りの画像を自然画領域と背景
領域とに分離し、それぞれの領域に応じて適応的に符号
化方式を変化させることにより、高圧縮な符号化を行う
ようにしている。符号化方式を変えるには、符号化方式
そのものを変える方法とパラメータのみを変える方法と
があるが、この実施例では、ハードウェアの共有化を考
慮して直交変換を行った後のハフマン符号のテーブルを
切り換えることによって圧縮率の向上を実現している。
【0040】図8において、像域分離部40は原画像デ
ータから文字パターンを除去した後の画像データをM×
N画素のブロック単位で背景領域か自然領域かを判定す
る。この判定には白画素の密度を用いる。すなわち、ブ
ロック内に輝度成分の濃度レベルが閾値Th以下の画素
が、例えば90%以上含まれるならば、そのブロックは
背景ブロックとする。この結果は、そのブロックの属性
情報として領域情報符号化部7(図1)に送られると共
に、ハフマン符号化テーブル41または42の一方を選
択するためのスイッチ部43の制御端子に供給される。
ハフマン符号化テーブル41は自然画用のテーブルであ
り、ハフマン符号化テーブル42は背景用のテーブルで
ある。
【0041】ADCT符号化部44では、図9に示すよ
うに、離散コサイン変換部50で入力画像に対しブロッ
ク単位(8×8画素)で2次元離散コサイン変換(DC
T)を施し、空間周波数領域に変換する。DCT演算を
行った結果は、ブロックの左上がDC(直流)成分とな
り、右下に行くほど高周波成分となる。自然画像の場合
には画素間の相関が高いため左上の方の低周波成分に大
きなDCT係数が現れることが多い。そこで、量子化部
51でDCT係数の低周波成分を小さな値で割り、高周
波成分を大きな値で割ることによって圧縮を行ってい
る。このときの各周波数成分に対する除数は、量子化テ
ーブル52に予め与えられている。量子化後の高周波成
分域の量子化係数値は「0」が多く続くため、図10に
示すようにジグザグスキャンの順に走査して「0」のラ
ンレグスと「0」以外の成分値に変換し、これに対して
ハフマン符号化部53でハフマン符号化テーブル54を
参照しながらハフマン符号化を行う。このハフマン符号
化テーブル54は、図8に示すハフマン符号化テーブル
41および42に対応する。
【0042】ハフマン符号化は出現確率の高い事象に対
し短い符号を割り当てるエントロピー符号化の一種であ
る。ハフマン符号化はDC成分とAC成分とに分けて行
う。DC成分の符号化は、基本的にDC成分値そのもの
ではなく前のブロックのDC成分値との差分を符号化す
る。全てのデータに対しハフマン符号を割り当てると、
そのテーブルを格納するために膨大な記憶領域を必要と
するため、DC成分値をカテゴリーと付加ビットとに分
解する。カテゴリーは成分値の集合体で、成分値を表現
するのに必要な最小ビット数Cに等しい。付加ビットは
成分値が正の場合はその値の下位Cビットで、成分値が
負の場合はその成分値から「1」を引いた値の下位Cビ
ットになる。例えば、DC成分の差分値が「10」(10
進数)の場合は、カテゴリーが「4」で、付加ビットは
“0010”となる。このカテゴリーに対しハフマン符
号が割り当てられることになる。図11に、輝度信号の
場合のハフマン符号テーブルの例を示す。
【0043】AC成分の場合の符号語は、「0」のラン
レングスと非「0」のAC成分のカテゴリー値で構成さ
れる。例えば、図10に示すような量子化係数が得られ
た場合には、ジグザグスキャンの結果、(0,3)、
(4,3)、(10,1)、EOB(End Of Block)と
いう事象が送られる。カッコ内の最初の数値は「0」の
ランレングスを示し、後の数値は非「0」のAC成分の
値である。この事象から「NNNNSSSS+付加ビッ
ト」を構成する。「NNNN」はランレングスを示す。
ランレングスは最大15までとなっているので4ビット
で表される。次の「SSSS」は非「0」の値のカテゴ
リーである。これも4ビットで表すため合計8ビットで
ハフマン符号化の符号語が構成される。付加ビットの作
り方はDC成分と同様である。“EOB”はブロックの
以下の値が全て零であることを示し、“0x00”で表
される。AC成分のハフマン符号化テーブルは、この
「NNNNSSSS」に対し出現頻度の高い符号語に短
い符号語を割り当てて圧縮を行う。
【0044】自然画像では輝度成分の量子化係数の非
「0」の値がAC成分の第1成分や第2成分にも比較的
高い確率で現れるため、“0x01”、“0x02”、
“0x03”、“0x11”の符号語に対しても2ビッ
トから4ビットの短い符号語が割り当てられている。し
かし、背景領域では第1成分や第2成分にさえも非
「0」の値は殆ど現れない。すなわち、“EOB”の出
現確率が極端に高くなる。したがって、背景領域では
“EOB”に最も近い符号を割り当てることによって大
幅に圧縮率を向上することが出来る。この理由から“E
OB”に割り当てる符号は1ビットないし2ビットが適
当であろう。
【0045】図8に戻り、ADCT符号化部44では、
先に述べたようにブロックの属性に応じて適応的にハフ
マン符号化テーブル41および42を切り換える。した
がって、テーブル以外のDCT変換部50、量子化部5
1、ハフマン符号化部53等は全てのブロックデータに
対して共通である。符号化の結果は他の符号化部の出力
と合成されて外部記憶装置9(図1)に記録される。
【0046】この実施例によれば、原画像から文字を除
去した画像から自然画領域と背景領域とを分離し、符号
化パラメータ(符号化テーブル)を変えることによって
それぞれに適した符号化を行っているので、簡易な構成
で符号化効率を向上することが出来る。
【0047】こうして外部記憶装置9に記憶された画像
データの復号化処理は、図12に示す復号化装置によっ
て行われる。復号化は符号化の逆の処理を行う。ただ
し、像域分離は行う必要がない。まず、外部記憶装置9
からデフォーマット部60にデータを読み出し、デフォ
ーマットして2値画像符号は2値画像復号化部61に、
自然画像符号は自然画像復号化部62に、領域情報は領
域情報復号化部63にそれぞれ出力する。2値画像復号
化部61および自然画像復号化部62における2値画像
符号および自然画像符号の復号は、領域情報復号化部6
3で復元された領域情報に従って制御される。そして、
最終的な復号はアプリケーションの要求に合わせて総合
復号部64でそれに適した形で行う。例えば、プリンタ
65に出力する場合は画像をラスター順に復元する。ま
た、ディスプレイ66に全体を表示する場合は間引きな
どを行った縮小画像を再生する。
【0048】
【発明の効果】この発明によれば、文字以外に地肌領域
も抽出するので、文字および白地領域は2値画像として
符号化でき、残りの絵柄領域だけを自然画像符号化を行
えばよいため、絵柄領域の少ない文書では大幅に圧縮率
を向上できる。また、文字・地肌領域は2値画像に変換
されるため文字が鮮明に再生され、また地肌も濃度ムラ
がなくなり高画質な画像を得ることができる。
【0049】また、ブロック単位の白地検出と網点検出
の結果を組み合わせて地肌領域を抽出しているので、絵
柄が網点で表現されている印刷原稿などにおいて精度良
く地肌領域を求めることができる。さらに、最終的に絵
柄領域を膨張させているので、文字・地肌ブロックの周
囲が絵柄領域で囲まれているような場合に、その文字・
地肌ブロックを絵柄ブロックに変更することにより絵柄
領域の誤判定を減らし、より高画質な復元画像を得るこ
とができる。
【0050】また、黒文字と白画素を画素単位で個別に
求めた後、ブロック内に含まれる黒文字ないし白画素の
密度によってブロック単位の像域分離を行うため、簡単
な処理で高精細度に文字・地肌領域を抽出することがで
きる。また、この発明によれば、文字・地肌ブロックを
1ブロック単位で符号化するため記憶容量の少ないバッ
ファメモリで符号化できる。さらに、連続する複数ブロ
ック単位で、または、1ブロック行単位で符号化するた
め、効率のよい符号化を行うことが出来る。
【0051】また、この発明によれば、自然画像に対し
て適切な解像度で符号化を行っているため、原画像のま
まで符号化する場合に比べ高圧縮が可能となる。また、
この発明によれば、原画像から文字を除去した画像に対
し背景領域と自然画領域とを分離し、符号化パラメータ
を変えることによってそれぞれに適した符号化を行って
いるので、高圧縮な符号化を行うことが出来る。
【図面の簡単な説明】
【図1】この発明による適応符号化方式の一実施例を示
すブロック図である。
【図2】図1における像域分離部の一実施例を示すブロ
ック図である。
【図3】像域分離部の他の実施例を示すブロック図であ
る。
【図4】ブロック単位で画像データを符号化する際のス
キャン方式を説明するための図である。
【図5】2値画像符号化部のブロック図である。
【図6】参照画素を抽出するためのテンプレートを示す
図である。
【図7】絵柄領域の解像度を低くして符号化する方式を
示す図である。
【図8】自然画像符号化部の他の実施例を示す図であ
る。
【図9】図8におけるADCT符号化部のブロック図で
ある。
【図10】量子化係数値のジグザグスキャンを示す図で
ある。
【図11】輝度信号のハフマン符号テーブルの例を示す
図である。
【図12】符号化した画像データを復号する復号化装置
の一例を示すブロック図である。
【符号の説明】
1 スキャナ 2 バッファ 3 像域分離部 5 2値画像符号化部 6 自然画像符号化部 7 領域情報符号化部 8 フォーマット部 9 外部記憶装置 10 MTF補正部 11 白地抽出部 12 エッジ抽出部 13,26 総合判定部 20 黒文字抽出部 21 白画素抽出部 22,23,25 バッファメモリ
───────────────────────────────────────────────────── フロントページの続き (58)調査した分野(Int.Cl.7,DB名) H04N 1/41 - 1/419 G06T 9/00

Claims (11)

    (57)【特許請求の範囲】
  1. 【請求項1】 階調性を有する自然画像と文字とが混在
    するカラー文書画像を、M×N画素のブロック単位で文
    字・地肌領域または絵柄領域の何れであるかを判定し、
    この判定結果に基づいて上記文字・地肌領域と判定した
    ブロックの画像データは2値画像に適した符号化を行
    い、上記絵柄領域と判定したブロックの画像データは絵
    柄領域に適した符号化を行うことを特徴とするカラー文
    書画像の適応符号化方式。
  2. 【請求項2】 請求項1において、前記地肌領域の判定
    は、画素単位に白画素か否かを判定して前記各ブロック
    毎に白画素数を求め、当該ブロック内の白画素数が所定
    の閾値以上存在し、かつ色画素を含まない場合は当該ブ
    ロックを白地ブロックとし、この白地ブロック内に網点
    領域が存在しない場合は当該ブロックを地肌領域とする
    ことを特徴とするカラー文書画像の適応符号化方式。
  3. 【請求項3】 請求項1において、前記文字・地肌領域
    と前記絵柄領域との像域分離は、前記文字領域と前記地
    肌領域とを抽出した後に前記各ブロック内にエッジ領域
    または地肌領域が存在し、かつ色画素が存在しない場合
    は当該ブロックを文字・地肌領域と判定し、その後に絵
    柄領域を膨張させることを特徴とするカラー文書画像の
    適応符号化方式。
  4. 【請求項4】 請求項1において、前記文字・地肌領域
    と前記絵柄領域との像域分離は、文字周辺の画素を抽出
    すると共に白画素を抽出し、これらの抽出結果の論理和
    を取ることによって文字または地肌の画素を抽出し、前
    記M×N画素ブロック単位で文字・地肌領域を判定する
    際に、当該ブロック内の文字または白画素の密度が高い
    場合は当該ブロックを文字・地肌ブロックと判定するこ
    とを特徴とするカラー文書画像の適応符号化方式。
  5. 【請求項5】 請求項1において、前記文字・地肌領域
    の符号化は、前記ブロック単位で行うことを特徴とする
    カラー文書画像の適応符号化方式。
  6. 【請求項6】 請求項1において、前記文字・地肌領域
    の符号化は、行方向に連続する複数の文字・地肌ブロッ
    クを単位として行うことを特徴とするカラー文書画像の
    適応符号化方式。
  7. 【請求項7】 請求項1において、前記文字・地肌領域
    の符号化は、1ブロック行の文字・地肌ブロックを単位
    として行うことを特徴とするカラー文書画像の適応符号
    化方式。
  8. 【請求項8】 請求項6または7において、前記文字・
    地肌ブロックの符号化が周囲の画素を参照する方式であ
    る場合は、前記絵柄ブロックに含まれる画素を所定の一
    定値とみなして符号化することを特徴とするカラー文書
    画像の適応符号化方式。
  9. 【請求項9】 請求項1において、前記絵柄領域の符号
    化は、前記文字・地肌領域よりも低い解像度に変換した
    後に行うことを特徴とするカラー文書画像の適応符号化
    方式。
  10. 【請求項10】 階調性を有する自然画像と文字とが混
    在するカラー文書画像から文字・地肌領域と絵柄領域と
    を分離し、さらに上記絵柄領域から背景領域を分離し、
    上記文字・地肌領域に対しては2値画像に適した符号化
    を行い、上記背景領域と上記背景領域を除去した絵柄領
    域とに対しては互いに異なるパラメータを用いて絵柄領
    域に適した符号化を行うことを特徴とするカラー文書画
    像の適応符号化方式。
  11. 【請求項11】 請求項10において、前記絵柄領域に
    適した符号化はADCT符号化であり、前記異なるパラ
    メータは背景領域に適したハフマン符号化テーブルと自
    然画像に適したハフマン符号化テーブルとであることを
    特徴とするカラー文書画像の適応符号化方式。
JP03164377A 1991-02-06 1991-07-04 カラー文書画像の適応符号化方式 Expired - Lifetime JP3108133B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP03164377A JP3108133B2 (ja) 1991-02-06 1991-07-04 カラー文書画像の適応符号化方式
US08/300,846 US5696842A (en) 1991-07-04 1994-09-06 Image processing system for adaptive coding of color document images

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
JP3-35107 1991-02-06
JP3510791 1991-02-06
JP3-56828 1991-03-20
JP5682891 1991-03-20
JP03164377A JP3108133B2 (ja) 1991-02-06 1991-07-04 カラー文書画像の適応符号化方式

Publications (2)

Publication Number Publication Date
JPH04356873A JPH04356873A (ja) 1992-12-10
JP3108133B2 true JP3108133B2 (ja) 2000-11-13

Family

ID=27288649

Family Applications (1)

Application Number Title Priority Date Filing Date
JP03164377A Expired - Lifetime JP3108133B2 (ja) 1991-02-06 1991-07-04 カラー文書画像の適応符号化方式

Country Status (1)

Country Link
JP (1) JP3108133B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102632579B1 (ko) 2021-04-26 2024-02-01 이민진 구조 역학적 저항력을 통한 선택적 하복부 압박 코르셋 시스템

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06314092A (ja) * 1993-04-28 1994-11-08 Toshiba Corp 文字画像用記録再生装置
US5848185A (en) 1994-12-28 1998-12-08 Canon Kabushiki Kaisha Image processing apparatus and method
US7218784B1 (en) * 2000-05-01 2007-05-15 Xerox Corporation Method and apparatus for controlling image quality and compression ratios
US6744919B2 (en) * 2001-07-24 2004-06-01 Hewlett Packard Development Company, L.P. Classification of blocks for compression based on number of distinct colors
JP4626473B2 (ja) 2005-10-12 2011-02-09 セイコーエプソン株式会社 画像処理装置、画像出力装置および方法
JP4236659B2 (ja) 2005-11-02 2009-03-11 シャープ株式会社 画像符号化装置、画像符号化方法、画像符号化プログラムおよび記録媒体
JP5682545B2 (ja) * 2011-11-29 2015-03-11 ブラザー工業株式会社 画像処理装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102632579B1 (ko) 2021-04-26 2024-02-01 이민진 구조 역학적 저항력을 통한 선택적 하복부 압박 코르셋 시스템

Also Published As

Publication number Publication date
JPH04356873A (ja) 1992-12-10

Similar Documents

Publication Publication Date Title
EP0411232B1 (en) Method for high-quality compression by binary text images
US5724441A (en) Image processing apparatus and method
EP0833519B1 (en) Segmentation and background suppression in JPEG-compressed images using encoding cost data
JP3095804B2 (ja) 画像データ伝送装置および画像データ伝送方法
EP1102209B1 (en) Image processing
JP3843581B2 (ja) 画像符号化装置、画像復号化装置および画像処理装置、並びに画像符号化方法、画像復号化方法および画像処理方法
US5442459A (en) Process for encoding a half tone image considering similarity between blocks
US5461682A (en) Image filing apparatus providing image data suitable for several input/output devices
US5465164A (en) Image processing method and device for the same
JP2006180456A (ja) 画像圧縮装置と画像復号装置と画像変換装置と画像処理方法
JP2011193394A (ja) 画像処理装置、画像処理方法、及びプログラム
JP3108133B2 (ja) カラー文書画像の適応符号化方式
US6272251B1 (en) Fully automatic pasting of images into compressed pre-collated documents
US8023756B2 (en) Image encoding apparatus and method of controlling same
JP3231800B2 (ja) 画像符号化装置及び画像符号化方法
JPH09205647A (ja) 画像符号化装置、画像復号化装置および画像処理装置
JPH10108011A (ja) データ処理装置
JPH06178122A (ja) カラー画像の適応符号化装置
JP4757172B2 (ja) 画像符号化装置及びその制御方法
JPH08298589A (ja) 写真・文書混在画像の画像処理装置
JP3083336B2 (ja) 画像処理装置およびその方法
JPH0918877A (ja) フラクタル画像圧縮装置
JPH0440075A (ja) 画像符号化装置
JPH08163375A (ja) 画像圧縮方法及びその装置
JP2001103315A (ja) 画像符号化方法および画像符号化装置

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20000801

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080908

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080908

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090908

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090908

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100908

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110908

Year of fee payment: 11

EXPY Cancellation because of completion of term