JP2008104121A - 画像符号化装置及びその制御方法 - Google Patents

画像符号化装置及びその制御方法 Download PDF

Info

Publication number
JP2008104121A
JP2008104121A JP2006286885A JP2006286885A JP2008104121A JP 2008104121 A JP2008104121 A JP 2008104121A JP 2006286885 A JP2006286885 A JP 2006286885A JP 2006286885 A JP2006286885 A JP 2006286885A JP 2008104121 A JP2008104121 A JP 2008104121A
Authority
JP
Japan
Prior art keywords
value
block
encoding
sub
replacement
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2006286885A
Other languages
English (en)
Other versions
JP2008104121A5 (ja
JP4743884B2 (ja
Inventor
Kenta Takarazaki
健太 寳▲崎▼
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2006286885A priority Critical patent/JP4743884B2/ja
Priority to US11/862,804 priority patent/US8041135B2/en
Publication of JP2008104121A publication Critical patent/JP2008104121A/ja
Publication of JP2008104121A5 publication Critical patent/JP2008104121A5/ja
Application granted granted Critical
Publication of JP4743884B2 publication Critical patent/JP4743884B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression Of Band Width Or Redundancy In Fax (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

【課題】 階調画像と文字/線画とが混在した画像をブロック単位に符号する場合に、文字/線画の画素が存在した画素を置き換える置換値を、周波数変換後の直流成分の発生をほぼゼロする値にするブロック歪を最小化することができる。また、隣接するブロックの階調画像の性質がほぼ等しい限りにおいては、隣接するブロックの直流成分が同じなる確率を高めることで、高い圧縮率を得る。
【解決手段】 直前のサブブロックの直交変換の直流成分値から導き出される置換候補値が、注目サブブロックの階調属性を持つ画素群の値の範囲内にある場合、置換値生成部105は、注目サブブロックの直流成分値が、直前のサブブロックの直交変換の直流成分値と近似させる値を置換値として決定する。そして、注目サブブロック内の文字線画として判定された画素データを、置換値で置換し、出力する。
【選択図】 図1

Description

本発明は、画像データを圧縮符号化する技術に関するものである。
従来、画像を符号化する方法として知られているものとしてJPEGが挙げられる。このJPEG符号化は、画像データ中の8×8画素のブロックを単位に符号化するものである。以下に説明する処理は全てこのブロックを単位として実行するものである。
先ず、入力したブロックに対し、直交変換(DCT;Discrete Cosine Transform)を行い、8×8個の直交変換係数を得る。次に、この直交変換係数に対して、量子化テーブルを用いて量子化を行う。ここで、量子化テーブルの要素の値を量子化ステップ幅と呼ぶ。量子化ステップ幅は、高周波成分の直交変換係数ほど大きい。量子化は、各直交変換係数をそれぞれに対応する量子化ステップ幅で除算し、小数点以下を四捨五入して丸めを行うものである。それ故、量子化後の値は高周波成分ほど小さな値になり、0の発生頻度が高くなる。次に、量子化後の値に対してDC成分(1つ)とAC成分(63個)で別々の符号化を行う。
DC成分に関しては、ブロック間の相関が強いため差分予測符号化を行った後、ハフマン符号化される。差分予測符号化は直前の値との差を符号化する方式である。ハフマン符号化は、発生頻度の高い値には短い符号を、発生頻度の低い値には長い符号を与えることで結果的に全体の符号長を短くする符号化方法である。
AC成分に対しては、ランレングス符号化を行った後、ハフマン符号化を行う。ランレングス符号化は、同一の値が長く続くほど符号化率が向上する符号化方法である。量子化後の値に対してジグザグスキャンを行うことにより、高周波成分の0の値を連続させることで符号化効率を向上させている。
JPEG符号化は、デジタルカメラ等のデバイスに搭載されていることもからもわかるように、自然画像に対しては良好な圧縮方法である。他方、文字や線画などの含まれる画像に対しては、画像の高周波成分が失われることを原因とするモスキートノイズや、直流成分の量子化誤差や高周波成分が失われることを原因とするブロック歪が起こりやすいという問題がある。そのため文字や線画などの解像度が保持したまま圧縮する方法として、画像を直交変換の単位となるブロックに分割する。そして、ブロック単位で予め指定された色若しくは濃度値の文字や線画などの解像情報を抽出し、その抽出した領域に対して適当な値で置換処理を行った階調情報を直交変換等で符号化する。一方、ブロック単位の色情報に対しては予測符号化等で符号化するといった方法が提案されている。
これは、画像を高周波成分の比較的少ない自然画像と、局所的に同一の濃度値を有する2値的な情報である文字や線画を合成したものとして仮定するものである。そして、その画像に対して直交変換符号化を用いて圧縮・伸長する際に発生する信号歪から文字や線画の情報を保護するために、文字・線画の2値情報を予め抽出しておき、2値情報に対しては劣化の生じない可逆符号化を行う。
例えば特許文献1においては、抽出領域への置換処理にて、ブロック内の抽出領域以外の領域を参照して置換処理を行う。具体的には、平均値演算部において抽出領域以外の領域の平均値を算出し、得られた平均値で抽出領域に対して置換処理を行う。あるいは、入力された画素を1サイクル遅延させ、抽出領域の画素に対して、その遅延させた画素で置換を行うという方法が示されている。このような方法で直交変換後のスペクトルを低周波領域に集中させ、圧縮・伸張後の画質劣化を抑える効果を得られる。
特開平4−326669号公報
しかしながら、上記従来の画像処理方法では、直交変換後の量子化の際に用いる量子化ステップ幅が粗いと、量子化誤差が発生する可能性が高く、その量子化誤差が画像のブロック歪を引き起こす原因の一つになっているという問題が残る。
また、直交変換後の係数のうち直流成分値を符号化する場合、注目ブロックの直流成分と、前のブロックの直流成分値との差分を符号化することが行われる。文字線画を含まない階調画像中の2つのブロックの直流成分はほぼ同じ値となるので、その差分は小さなものとなり、符号化効率は高いと言える。
しかしながら、階調画像上に文字線画が含まれる領域内の2つ隣接ブロックに着目する。このようなケースの場合、それぞれのブロックに含まれる文字線画の画素数が同じとなることはむしろ希であり、必然、2つのブロックの直流成分の差はゼロになる可能性は低い。つまり、直流成分の符号化データ長は最小とはならず、まだまだ改善の余地が残る。
本発明はかかる問題点に鑑みなされたものであり、ブロック歪みの発生を抑制し、階調画像と文字/線画とが混在した画像を効率良く符号化する技術を提供しようとするものである。
かかる課題を解決するため、例えば本発明の画像符号化装置は以下の構成を備える。すなわち、
文字/線画画像データと階調画像データが混在した画像データを符号化する画像符号化装置であって、
画像データを複数の画素で構成されるブロックを単位に入力する入力手段と、
入力したブロックの画像データから、文字/線画の画素データと、文字線画の画素データか階調属性の画素データかを識別するための識別情報を抽出する抽出手段と、
該抽出手段で抽出した前記文字/線画画素データを符号化する第1の符号化手段と、
前記抽出手段で抽出した前記識別情報を符号化する第2の符号化手段と、
前記入力手段で入力したブロックに含まれる、直交変換を行なう単位であるサブブロックの各々に対し、当該サブブロック中の文字/線画として抽出した画素データを、階調属性を持つ画素データに基づいて決定される置換値で置換する置換手段と、
該置換手段で置換された後の各サブブロックの画像データを直交変換し、符号化する第3の符号化手段と、
前記第1乃至第3の符号化手段で生成された符号化データを合成し、ブロック単位の符号化データを生成する符号列生成手段とを備え、
前記置換手段は、
注目サブブロックが階調属性を持つ画素のみで構成されると仮定した場合の直流成分を算出する直流成分算出手段と、
直前のサブブロックの直流成分値に基づいて決定される置換候補値が、注目サブブロック内の階調属性を持つ画素群の値の範囲内にあるか否かを判断する判断手段と、
該判断手段で、前記置換候補値が前記範囲内にあると判断した場合、注目サブブロックの直流成分値が前記直前のサブブロックの直流成分値と近似する値を前記置換値として決定し、
前記判断手段で、前記置換候補値が前記範囲外にあると判断した場合、注目サブブロックが階調属性の画素のみを持つと仮定した場合の前記注目サブブロックの直流成分値に近似させる値を、前記置換値とする決定手段とを備える。
本発明によれば、階調画像と文字/線画とが混在した画像をブロック単位に符号する場合に、文字/線画の画素が存在した画素を置き換える置換値を、周波数変換後の直流成分の発生をほぼゼロする値にするブロック歪を最小化することができる。また、隣接するブロックの階調画像の性質がほぼ等しい限りにおいては、隣接するブロックの直流成分が同じなる確率を高めることで、高い圧縮率を得ることが可能になる。
以下、添付図面に従って本発明に係る実施形態を詳細に説明する。
図5は実施形態における画像圧縮装置のブロック構成図である。
ブロック化部501は、符号化対象の画像データからn×m画素で構成されるブロックを単位に入力し、それを8×8画素のサブブロック単位に分割し、そのサブブロックの画像データを出力する。ここで、n、mは8の整数倍である。説明を簡単なものとするため、ここでは、n=m=16として説明する。すなわち、ブロック化部501は、図6に示すように、16×16画素のブロックを入力し、4つの8×8画素のサブブロックの画像データを出力する。出力順は、図6に示すようにサブブロック0、1、2、3の順であるとする。
抽出部501は、ブロックの画像(4つのサブブロックの画像)から、予め定められた方法により抽出色を決定し、出力する。また、抽出部501はブロック内に存在する抽出色の位置を示した情報を、位置情報として出力する。この位置情報は、ブロック内の各画素が、抽出色領域内の画素であるか、非抽出色領域内の画素であるかを示す識別情報とも言える。それ故、この位置情報は16×16個の2値データ、すなわち、16×16ビットのデータである。
置換部503は、入力された位置情報より、サブブロック単位に抽出色領域の画素に対して置換処理を行い、階調情報として出力する。
第1の符号化部504は、入力されたブロックの抽出色情報を可逆圧縮して出力する。第2の符号化部505は、入力されたブロックの位置情報を可逆圧縮して出力する。第3の符号化部506は、入力されたブロックに含まれる4つのサブブロックの階調情報を非可逆圧縮(実施形態ではJPEG符号化)して出力する。そして、符号列生成部507は、各符号化部で生成された符号化データを結合し、ブロック単位の符号化データ列を生成し、出力する。
説明を簡単なものとするため、本実施形態での符号化対象の画像データは1画素1成分であり、1画素が8ビット(256階調)の画像(グレースケール画像)とする。また、値255は黒、値0は白として説明する。つまり、画素値は濃度を示すとして説明する。ただし、これは一例であって、これに限るものではない。
実施形態における抽出部502について先ず、説明する。
自然画もしくはCGグラデーション画像中に、黒もしくは黒に近い文字線画が存在するとき、そのブロックの濃度のヒストグラムは図7(a)、(b)のようになる。図7(a)は文字線画の濃度が、背景(自然画、CGグラデーション画像)の濃度に対して、十分に異なる値を持っている場合を示している。この状況はちょうど、文字線画が背景画像とはっきりと区別して視認できる状況である。同図(b)は、同図(a)ほどではないが、文字線画と背景とは一応区別できる状況を示している。いずれの場合でも、頻度のピークは2つ現れるので、2つのピーク間の極小値の位置(図10(a)の場合には、2つのピーク間の無頻度の位置でも良い)を閾値として決定する。
抽出部502は、上記のようにして閾値を決定し、閾値を越える値を持つ画素を抽出色を持つ画素として決定する。そして、抽出色を持つ画素位置を特定するため、入力したブロックの16×16画素を、決定した閾値で2値化し、これを位置情報として符号化部505、置換部503に出力する。なお、2値化は、閾値を越える画素値は“1”、閾値以下の画素値は“0”とする。図8(a)は、この位置情報を示している。また、置換部503は、8×8画素のサブブロック単位に置換処理を行なう。従って、抽出部502は、抽出した16×16ビットの位置情報のうち、置換部503の置換処理で利用されるサブブロックに相当する位置の8×8ビットの位置情報を置換部503に供給する。なお、置換部503内に、1ブロック分の位置情報を記憶保持するバッファを備える場合には、この限りではない。
抽出部502は、1ブロック分の16×16をラスタースキャンし、位置情報が“1”である入力画素値を順番に抽出して、図8(b)のように一次元に並べ、その画素値を抽出色情報として符号化部504に出力する。
符号化対象の画像データは、イメージスキャナ等で光学的に読取った画像データである場合、読取り精度等に起因して、文字線画の各画素は単一色となるとは限らない。従って、図8(b)に示すように、ある程度ばらついた値となるが、その分散は小さい。従って、本実施形態における符号化部504は、例えば予測符号化を利用した可逆符号化を採用する。
なお、イメージスキャナを介在せず、コンピュータからダイレクトに出力された画像データ、或いは、コンピュータからの印刷データに従ってレンダリングした画像を符号化する場合、誤差は発生しないので、文字線画は単一の色(濃度)となる。従って、このような場合には、閾値を越える画素は全て同じ値を持つので、抽出色情報は1個のデータとなる。この場合、符号化部504はその1個のデータを符号化すればよい。
また、位置情報は、図8(a)に示すように16×16個の2値データであるので、符号化部505は、2値データに特化した可逆符号化(予測符号化、ランレングス符号化等)を行なえばよい。
また、抽出部502は、ブロック内の濃度に対する頻度のピークが1つしか存在しなかった場合、言い替えれば、ブロック内に抽出色の領域が存在しない場合、位置情報の全ビットを“0”として出力する。このとき、抽出部502は、注目ブロック内に抽出色情報無しを示す信号を符号列生成部507に出力する。また、ブロック内に抽出色領域が存在する場合には、抽出色情報有りを示す信号を符号列生成部507に出力する。
一方、実施形態における符号化部506は、JPEG(非可逆)符号化を行なう。JPEG符号化は、デジタルカメラ等に搭載された符号化技術であり、自然画に対して高い圧縮率を有することで知られている。このJPEGは、人間の視覚が高周波成分に対して鈍感であることを利用し、その高周波成分をある程度除去して情報量を少なくしてから、符号化するものである。しかしながら、文字線画等は、そのエッジが鮮明であることが望ましい。言い方を変えれば、文字線画は高周波成分が維持されることが望ましいと言える。
かかる点、本実施形態では、文字線画部分は、符号化部505、504にて可逆符号化されることになり、理論上、完全に元の値に復元できる。
JPEG符号化は、8×8画素のサブブロックのDCT変換(直交変換)、量子化、エントロピー符号化の処理を経て、符号化データを生成する。文字線画を含むサブブロックをDCT変換すると、その文字線画の存在によって得られる変換係数に影響が現れる。また、量子化処理では、高周波成分の変換係数ほど大きな量子化ステップで量子化するが、それでも完全に高周波成分をカットするわけにはいかない。もし、高周波成分を完全にカットするほど大きな量子化ステップを用いてしまうと、自然画と言えども画質が劣化したものとなってしまうからである。
そこで、本実施形態では、文字線画が存在するサブブロックをJPEG符号化する際、そのサブブロックには文字線画が存在していないのと等価のブロックを生成し、符号化部506でJPEG符号化を行なうようにする。これを実現するのが、図5の置換部503である。
以下、実施形態における置換部503について説明する。
図1は、実施形態における置換部503の詳細ブロック図である。置換部503は、目標値算出部101、係数値算出部102、代表値生成部103、2つの置換候補値算出部104及び107、置換値生成部105、代表値選択部106、及び、候補値選択部108で構成される。以下、実施形態における置換部503を構成する各構成要素について説明する。
目標値算出部101は、1サブブロック分の8×8画素データと、該当するサブブロックの8×8ビットの位置情報をもとに、抽出色を持つ画素を除く画素の値の合計値D、抽出色を持つ画素を除く画素(非抽出色領域の画素)の値の平均値Dave、及び、抽出色として判定された画素の個数Nを算出する。また、目標値算出部101は、非抽出色領域内の画素値の最大値Max、最小値Minを求める。
ここで予め説明しておくが、抽出色と判定された画素の個数Nが0の場合、以下に説明する処理は行なわず、置換生成部105は、入力した画素値をそのまま符号化部906に出力するものである。以下では、Nが0以外である場合の説明である点に注意されたい。また、抽出色と判定された画素数ではなく、非抽出色と判定された画素数でも構わない。「抽出色と判定された画素数=64−非抽出色と判定された画素数」の関係を有し、一方を算出することは、他方を算出することと等価であるからである。
サブブロックの8×8画素内の座標(i,j)の画素の値をXi,jと表わし、8×8個の位置情報をTi,jとする。ここで、Ti,jは、“0”、“1”のいずれかの値である。Ti,j=1の場合、画素Xi,jは抽出色を持つ画素、すなわち、文字線画として判定された画素を意味する。Ti,j=0の場合、画素Xi,jは非抽出色を持つ画素、すなわち、自然画(or背景画像)として判定された画素を意味する(図8(a)参照)。従って、合計値D、平均値Dave、個数Nは次のように算出される。また、i,jは0以上7以下の整数である。
N=ΣΣTi,j
D=ΣΣXi,j×(1−Ti,j
Dave=D/(64−N)
ここでΣΣはi,j=0,1,2,…7の合算を示す。
図2は、目標値算出部101の具体的な処理手順を示すフローチャートである。以下、同図にしたがってその処理手順を説明する。
先ず、ステップS201では、合計値を求める変数Dと個数を求める変数Nをそれぞれ0に初期化する。また、最小値MINに初期値として“255”、最大値MAXに初期値として“0”を代入する。
次いで、ステップS202において、注目画素が抽出色領域内の画素か否か、すなわち、注目画素が抽出色を持つ画素であるか否かを、位置情報に基づき判定する。注目画素が非抽出色領域の画素であると判定した場合、処理はステップS203に進み、変数Dに注目画素データの値を加算する。そして、ステップS209に処理を進める。
一方、注目画素が抽出色領域内の画素であると判定した場合、処理はステップS204にすすみ、変数Nを“1”だけ増加する。
この後、処理はステップS205に進み、注目画素の値が変数MINの値より小さいか否かを判断する。注目画素値が変数MINの値より小さいと判断した場合、ステップS206にて、変数MINに注目画素の値を代入することで、変数MINを更新する。
また、ステップS207では、注目画素の値が変数MAXの値より大きいか否かを判断する。注目画素値が変数MAXの値より大きいと判断した場合、ステップS208にて、変数MAXに注目画素の値を代入することで、変数MAXを更新する。
ステップS209では、サブブロック内の全画素(64画素)分の処理を行なったか否かを判断する。否の場合には、次の画素の処理を行なうため、ステップS202以降の処理を繰り返す。
また、ステップS209にて、サブブロック内の全画素分の処理が行なったと判断した場合、処理はステップS210に進み、上記のようにして求めたD、Nに基づき、非抽出色領域内の画素の平均値Daveを求める。
以上の結果、目標値算出部101は、サブブロック単位に、非抽出色領域の画素値の合計値D及びその平均値Dave、抽出色領域内の画素数N、及び、非抽出領域内の最大値MAX及び最小値MINを得ることができる。
次に、係数値算出部102について説明する。この係数値算出部102は、目標値算出部101より出力された合計値D、平均値Dave、個数Nに基づき、DCT変換で得られる直流成分であるDC係数を算出する。
一般に、DCT変換は、画素値をXi,j、変換して得られる係数をYu,vとするとき、次の演算を行なう。
u,v=(1/4)α(u)α(v)ΣΣ(Xi,j-128)cos((2i+1)uπ/16)cos((2j+1)vπ/16)
ここで、直流成分DCを求める場合に限ると、u、vは共に“0”となり、α(0)は1/√2である。従って、DCT変換後の直流成分DCは次式(1)となる。
DC=Y0,0=(1/8)ΣΣ(xi,j-128) …(1)
本実施形態の置換部903は、基本的には、サブブロック内の抽出色を持つと判定された画素の値を、非抽出色と判定された画素の平均値Daveを持つように置換する。このため、係数値算出部102は、上記式(1)を、目標値算出部101で算出されたD、Dave、Nを用いて次式(2)のように変形し、仮のDC成分を算出し、代表値生成部103に出力する。
DC={非抽出色領域の画素の合計値+(非抽出色領域の画素の平均値*抽出色領域内の画素数)−128×64}/8
=(D+Dave×N−128×64)/8 …(2)
次に、実施形態における代表値生成部103について説明する。
JPEGでは、先に説明したように、DCT変換して得られた各係数を量子化する。ここで、実施形態における符号化部506で行なうDC成分の量子化ステップ値は「16」であるとして説明する。通常、量子化した際、小数点以下の値が発生するので、小数点以下を四捨五入することが行われる。
そこで、本実施形態の代表値生成部103は、係数値算出部102で算出されたDC成分値に「8」(量子化ステップの半分の値)を加算した後、下位4ビットを0にする。この結果、係数値算出部102で算出されたDC成分値を、量子化ステップの整数倍にでき、符号化部506で行われる量子化処理で発生する誤差を実質的に0にする。つまり、代表値生成部103は、係数算出部102で算出されたDC成分値を、量子化ステップの整数倍で、そのDC成分値に近似する値に変換し、その結果を量子化代表値Dpとして代表値選択部106に出力する。
次に、一方の置換候補値算出部104について説明する。
ここで、注目サブブロックの量子化代表値を仮にDpと表わす。抽出色領域内の画素の値Zをすると、DpとZは、式(2)を参照すると、次式(3)を満たす必要がある。
Dp=(D+Z×N−128×64)/8 …(3)
ここで、注目サブブロックの直前のサブブロックの量子化代表値Dp-1と表わす。注目サブブロックの量子化代表値Dpが直前のサブブロックの量子化代表値Dpと等しくするためには、式(3)は次式(3’)のようになる。
Dp-1=(D+Z×N−128×64)/8 …(3’)
置換候補値算出部104は、目標値算出部101からの注目サブブロックの抽出色領域内の画素数N、非抽出色領域の画素の合計値Dと、後述する代表値選択部106によって選択した直前のサブブロックの代表値Dp-1を入力し、候補値Zと剰余値Rを生成する。
Z=(8×Dp-1−D+128×64)/N …(4)
=(8×(直前のサブブロックの量子化代表値)−(非抽出色領域の画素の合計値)−128×64}/(抽出色領域と判定された画素数)
R=(8×Dp-1−D+128×64)%N …(5)
ここで、「A % B」は整数Aを整数Bで除算した際の余りを返す関数である。
つまり、抽出色を持つと判定された各画素の値を、式(4)で求めた値にすれば、後段の符号化部506で量子化した際のDC成分に誤差は発生しないことになる。ただし、画素値は整数でなければならない。つまり、このままでは、式(4)による剰余値(余り)が無視されてしまう。それ故、置換候補値算出部104は、式(5)で剰余値Rを算出する。詳細は後述するが、この剰余値Rは抽出色領域の画素群に分配されるものである。
置換候補値算出部104は、上記のようにして算出した候補値Zを量子化代表値として代表値選択部106に出力すると共に、剰余値Rを候補値選択部108に出力する。
なお、実施形態では、1つのブロックには、4つのサブブロックが存在するものとして説明している。従って、最初のサブブロック0を注目サブブロックとしたとき、その直前のサブブロックは存在しない。つまり、注目サブブロックが最初のサブブロック0であるとき、置換候補値算出部104は意味のない処理を行なうことになる。しかし、以下に説明する代表値選択部106は、最初のサブブロック0に対する代表値を選択するときには、代表値生成部103からの代表値Dpを選択するので、問題は発生しない。
以下、この代表値選択部106について説明する。代表値選択部106は、代表値生成部103、置換候補値算出部104から出力される量子化代表値のいずれか一方を選択し、出力する。その選択の条件は次の通りである。
i)サブブロック0用の量子化代表値を選択するとき
代表値選択部106は、代表値生成部103で生成した量子化代表値Dpを選択し、置換候補値算出部107、及び、置換候補値104に出力する。このとき、選択した量子化代表値を内部のメモリ(不図示)に保存し、代表値生成部103からの量子化代表値を選択した旨の制御信号を候補値選択部108に通知する。
なお、代表値選択部106から置換候補値算出部104に出力される量子化代表値Dpは、置換候補値算出部104が次のサブブロックの処理を行なう際の、直前のサブブロックの量子化代表値となる。
ii)サブブロック0以外のサブブロック1、2、3の量子化代表値を選択するとき
代表値選択部106は、置換候補値算出部104から出力された候補値Zと、目標値算出部101で算出されたMIN、MAXとの関係が次の条件を満たすか否かを判定する。
MIN≦Z<MAX …(6)
上記の不等式(6)を満たさないのは、注目サブブロック内に含まれる非抽出色領域内の各画素の色が、直前のサブブロックのそれとは異なっていることを意味する。従って、注目サブブロックの量子化代表値として、置換候補値算出部104で算出された候補値を選択してしまうと、置換後のサブブロック内の階調値の取り得るレンジが大きくなる。この結果、符号化部506内でのDCT変換後の高周波成分ACには、0以外の値が多く含まれる可能性高くなり、符号化効率が悪くなる。それ故、代表値選択部106は、不等式(6)を満たさないと判定した場合には、代表値生成部103で生成した量子化代表値Dpを選択し、置換候補値算出部107、及び、置換候補値104に出力する。
一方、不等式(6)を満たすと判定した場合には、代表値選択部106は置換候補値算出部104からの候補値を量子化代表値Dpとして選択し、置換候補値算出部107、及び、置換候補値104に出力する。この結果、注目サブブロックの量子化代表値と直前のサブブロックの量子化代表値が同じ値となるので、差分DC成分を符号化した際の符号長は最小とすることもできる。
なお、いずれを選択、出力した場合であっても、代表値選択部106は選択した量子化代表値を内部のメモリに格納し、いずれを選択したのかを示す制御信号を候補値選択部108に通知する。
もう一つの置換候補値算出部107は、置換候補値算出部104の処理と実質的に同じである。ただし、置換候補値算出部107が、参照するのは代表値選択部106から出力された量子化代表値である。
次に、候補値選択部108について説明する。この候補値選択部108は、代表値選択部106からの制御信号に従い、置換値候補算出部104で算出された候補値及び剰余値の組と、置換値候補算出部107で算出された候補値及び剰余値の組のいずれか一方を選択し、置換値生成部105に出力する。
具体的には、代表値選択部106からの制御信号が、代表値生成部103からの量子化代表値を選択したことを示す場合、注目サブブロックのDC成分を量子化代表値生成部103の量子化代表値に一致させることを意味する。従って、この場合、代表値選択部106は、置換候補値算出部107の候補値と置換値を選択し、出力する。一方、代表値選択部106からの制御信号が直前サブブロックの量子化代表値を選択したことを示している場合、注目サブブロックのDC成分を直前サブブロックの量子化代表値に一致させる。このため、代表値選択部106は、置換候補値算出部104からの候補値と置換値を選択し、出力する。
次に、置換値生成部105について説明する。この置換値生成部105は、先に説明したように、注目サブブロックにおける位置情報が全て“0”、すなわち、注目サブブロック内に抽出色領域が存在しない場合には、入力したサブブロックの画素値をそのまま符号化部506に出力する。
ここでは、注目サブブロック内に抽出色領域が存在するものとして説明する。この場合の置換値生成部105の処理を図3のフローチャートに従って説明する。この処理は、注目サブブロック内の抽出色領域内の画素値を、候補値選択部108より出力された候補値Zで置換すると共に、置換対象となったR個の画素に「1」を更に加算することで、剰余値Rを分配するものである。
図3のフローチャートにおいて、注目画素の位置の更新方向は、ラスタースキャン方向として説明する。
先ず、ステップS301に、カウンタCに初期値として剰余値Rをセットする。
次いで、ステップS302において、注目画素は抽出色領域内にあるか否かを判断する。注目画素が非抽出領域内にあると判定した場合には、ステップS306に進み、入力した画素データをそのまま出力する。
また、ステップS302にて、注目画素は抽出色領域内にあると判断した場合、処理はステップS303に進み、カウンタCが“0”となったか否かを判断する。否の場合には、ステップS304に進む。このステップS305では、入力した注目画素値の代わりに、「Z+1」を出力する。そして、カウンタCを“1”だけ減じる。
ステップS307では、64個の画素データの出力を終えたか否かを判断する。否の場合には、ステップS302に戻る。
上記の処理の結果、抽出色領域内にあると判断し、尚且つ、カウンタCが“0”以外である場合には、ステップS304の処理が行われるが、カウンタCが“0”となった場合、処理はステップS305に進む。このステップS305では、入力した注目画素値の代わりに、候補値Zを出力する。
置換値生成部105による処理内容を、図4(a)乃至(d)を参照して説明する。
同図(a)乃至(d)は1ブロックに含まれる4つのサブブロックの置換処理後の階調画像データを示している。図中、斜線で示される領域が各サブブロックの抽出色領域を示している。図示の場合、各々のサブブロックのDC成分は全て「−800」となる。この結果、符号化部506における先頭のサブブロック0に後続するサブブロック1、2、3の量子化後のDC成分の差分値は0が連続する。また、量子化ステップ幅を16とすると、量子化の際に量子化誤差も発生していない。
符号列生成部507は、抽出部502から、抽出色情報有りを示す信号を受信した場合、抽出色領域有りを示す識別ビット(例えば“1”)を有するヘッダを生成する。そして符号列生成部507は、そのヘッダと、符号化部504乃至506から出力された抽出色情報符号化データ、位置情報符号化データ、及び、4つのサブブロックの階調符号化データとを結合し、出力する。図9(a)はこの場合の1つのブロックの符号化データの構造を示している。
また、符号列生成部507は、抽出部902から、抽出色情報無しを示す信号を受信した場合、抽出色領域無しを示す識別ビット(例えば“0”)を有するヘッダを生成する。そして符号列生成部507は、そのヘッダと、符号化部506から出力された4つのサブブロックの階調符号化データとを結合し、出力する。つまり、位置情報、抽出色情報の符号化データは無視する。図9(b)はこの場合の1つのブロックの符号化データの構造を示している。
なお、上記の符号化データを復号する装置のブロック構成図を図10に示し、その復号処理の流れを一応説明する。図示に示すように、装置は、符号化用データバッファ601、解析・分離部602、抽出色情報復号部603、位置情報復号部604、階調画像復号部605、及び、画像ブロック生成部606で構成される。
1ブロック分の符号化データが符号化データバッファ601に格納されると、解析・分離部602は、その符号化データのヘッダを解析し、その中の識別ビットを判定する。識別ビットが“1”である場合、符号化データは図9(a)の構造であることを意味するので、解析・分離部602は、符号化データ用バッファ601に格納された各符号化データを復号部604乃至606それぞれに分配する。また、このとき、解析・分離部602は識別ビットの情報を画像ブロック生成部606に出力する。階調画像復号部605は入力した4つのサブブロックの符号化データを復号し、1ブロック分、すなわち、16×16画素の画像データを生成し、画像ブロック生成部607に出力する。
また、識別ビット“0”である場合、ブロックの符号化データは図9(b)の構造であることを意味する。従って、解析・分離部602は、符号化データ用バッファ601に格納された符号化データを階調画像復号部606のみに分配する。また、このとき、解析・分離部602は識別ビットの情報を画像ブロック生成部606に出力することも行なう。階調画像復号部606は、4つのサブブロックの符号化データを復号し、1ブロック分、すなわち、16×16画素の画像データを生成し、画像ブロック生成部607に出力する。
画像ブロック生成部607は、解析・分離部602からの識別ビットが“0”である場合、階調画像復号部605から出力された16×16画素のブロックの画像データを、そのまま出力する。
また、画像ブロック生成部607は、解析・分離部602からの識別ビットが“1”である場合、位置情報が“0”となっている画素については、階調画像復号部605から出力された画素データを出力する。また、位置情報が“1”である画素については、抽出色情報生成部603で復号された画素データを順番に出力する。
以上説明したように本実施形態によれば、ブロック中に含まれる各サブブロック内に抽出色領域が含まれ、且つ、着目サブブロック内の非抽出色領域の最大値と最小値との間に、直前のサブブロックのDC成分があったとする。この場合、本実施形態によれば、注目サブブロックの量子化代表値をその直前の量子化代表値と一致させるように、注目サブブロック内の抽出色領域内の画素値の置換値を決定する。この結果、各サブブロック内の階調画素値には高周波成分が少なくなり、尚且つ、注目サブブロックと直前のサブブロックの直流成分の差をゼロにすることが可能になる。すなわち、サブブロックの歪みの発生を抑制し、生成される符号量も少なくできる。
一方、着目サブブロック内の非抽出色領域の最大値と最小値との間に、直前のサブブロックのDC成分がない場合には、注目サブブロック自身の量子化代表値と一致するように、注目サブブロック内の抽出色領域内の画素値の置換値を決定する。この結果、サブブロック間の直流成分の差はゼロにはならないものの、注目サブブロック内の階調画素値には高周波成分が少なくなり、サブブロック歪みの発生が抑制され、尚且つ、生成される符号量も少なくできる。
なお、上記実施形態では連続するサブ・ブロックのDC成分の量子化後の値を可能な限り一致させると説明したが、これに限らず、連続するサブ・ブロックのDC成分の量子化後の差分値を可能な限り小さくさせる構成でも良い。この場合、置換候補値算出部104は、直前サブ・ブロックの量子化代表値と量子化代表値生成部103にて生成される量子化代表値の間に位置する量子化代表値から複数の候補値と剰余値のセットを生成する。そして、不等式(6)を満足する候補値の中で、最も直前サブ・ブロックの量子化代表値に近くなる値を選択する。この構成により、AC成分の符号量を抑えつつ、DC成分の符号量を最小化することが可能となる。
以上、本発明に係る実施形態を説明したが、CPUやMPU等のプロセッサがコンピュータプログラムを実行することで、図5に係る構成の機能を実現しても構わない。すなわち、本発明は、コンピュータプログラムをもその範疇とする。また、通常、コンピュータプログラムは、CD−ROM等のコンピュータ可読記憶媒体に格納されている。そして、そのコンピュータ可読記憶媒体を、読取り装置(CD−ROMドライブ)にセットし、システムにコピーもしくはインストールすることで実行可能となる。従って、このようなコンピュータ可読記憶媒体も本発明の範疇にあることも明らかである。
実施形態の置換部のブロック構成図である。 実施形態の目標値算出部の処理内容を説明するためのフローチャートである。 実施形態の置換値生成部の処理内容を説明するためのフローチャートである。 置換値生成部の処理結果の一例を示す図である。 実施形態の画像符号化装置のブロック構成図である。 符号化単位のブロックとサブブロックとの対応関係を示す図である。 抽出部の処理内容を説明するための図である。 抽出部が生成する位置情報、及び、抽出色情報の一例を示す図である。 符号列生成部が生成する1ブロック分の符号化データの構造を示す図である。 実施形態における画像復号装置のブロック構成図である。

Claims (7)

  1. 文字/線画画像データと階調画像データが混在した画像データを符号化する画像符号化装置であって、
    画像データを複数の画素で構成されるブロックを単位に入力する入力手段と、
    入力したブロックの画像データから、文字/線画の画素データと、文字線画の画素データか階調属性の画素データかを識別するための識別情報を抽出する抽出手段と、
    該抽出手段で抽出した前記文字/線画画素データを符号化する第1の符号化手段と、
    前記抽出手段で抽出した前記識別情報を符号化する第2の符号化手段と、
    前記入力手段で入力したブロックに含まれる、直交変換を行なう単位であるサブブロックの各々に対し、当該サブブロック中の文字/線画として抽出した画素データを、階調属性を持つ画素データに基づいて決定される置換値で置換する置換手段と、
    該置換手段で置換された後の各サブブロックの画像データを直交変換し、符号化する第3の符号化手段と、
    前記第1乃至第3の符号化手段で生成された符号化データを合成し、ブロック単位の符号化データを生成する符号列生成手段とを備え、
    前記置換手段は、
    注目サブブロックが階調属性を持つ画素のみで構成されると仮定した場合の直流成分を算出する直流成分算出手段と、
    直前のサブブロックの直流成分値に基づいて決定される置換候補値が、注目サブブロック内の階調属性を持つ画素群の値の範囲内にあるか否かを判断する判断手段と、
    該判断手段で、前記置換候補値が前記範囲内にあると判断した場合、注目サブブロックの直流成分値が前記直前のサブブロックの直流成分値と近似する値を前記置換値として決定し、
    前記判断手段で、前記置換候補値が前記範囲外にあると判断した場合、注目サブブロックが階調属性の画素のみを持つと仮定した場合の前記注目サブブロックの直流成分値に近似させる値を、前記置換値とする決定手段と
    を備えることを特徴とする画像符号化装置。
  2. 第1、第2の符号化手段は可逆符号化手段であり、前記第3の符号化手段は非可逆のJPEG符号化手段であって、
    1サブブロック内の文字線画の属性を持つ画素の個数をN、階調属性を持つ画素データの総和、及び、その平均値をD,Daveとしたとき、
    前記直流成分算出手段は、DCT変換時に算出される直流成分DCを、次式によって求め、
    DC=(D+Dave×N−128×64)/8
    前記決定手段は、直前のサブブロックの直流成分をDC-1、注目サブブロックの直流成分をDC0としたとき、注目サブブロックにおける前記置換値Zを次式のいずれかに従って決定する
    Z=(8×Dp-1−D+128×64)/N
    又は、
    Z=(8×Dp0−D+128×64)/N
    ことを特徴とする請求項1に記載の画像符号化装置。
  3. 更に、前記置換手段は、前記置換値Zを求める際に発生した剰余値Rを次式に従って求め、
    R=(8×Dp-1−D+128×64) % N
    又は、
    R=(8×Dp0−D+128×64) % N
    (A%Bは整数Aを整数Bで除算した際の余りを返す関数)
    前記文字線画として判定された「N−R」個の画素のデータを置換値Zで置換し、
    前記文字線画として判定されたR個の画素のデータを「Z+1」で置換する
    ことを特徴とする請求項2に記載の画像符号化装置。
  4. 注目サブブロックが1ブロックの先頭のサブブロックである場合、前記決定手段は、注目サブブロックが階調属性の画素のみを持つと仮定した場合の直流成分値に近似する値を前記置換値とすることを特徴とする請求項1に記載の画像符号化装置。
  5. 文字/線画画像データと階調画像データが混在した画像データを符号化する画像符号化装置の制御方法であって、
    画像データを複数の画素で構成されるブロックを単位に入力する入力工程と、
    入力したブロックの画像データから、文字/線画の画素データと、文字線画の画素データか階調属性の画素データかを識別するための識別情報を抽出する抽出工程と、
    該抽出工程で抽出した前記文字/線画画素データを符号化する第1の符号化工程と、
    前記抽出工程で抽出した前記識別情報を符号化する第2の符号化工程と、
    前記入力工程で入力したブロックに含まれる、直交変換を行なう単位であるサブブロックの各々に対し、当該サブブロック中の文字/線画として抽出した画素データを、階調属性を持つ画素データに基づいて決定される置換値で置換する置換工程と、
    該置換工程で置換された後の各サブブロックの画像データを直交変換し、符号化する第3の符号化工程と、
    前記第1乃至第3の符号化工程で生成された符号化データを合成し、ブロック単位の符号化データを生成する符号列生成工程とを備え、
    前記置換工程は、
    注目サブブロックが階調属性を持つ画素のみで構成されると仮定した場合の直流成分を算出する直流成分算出工程と、
    直前のサブブロックの直流成分値に基づいて決定される置換候補値が、注目サブブロック内の階調属性を持つ画素群の値の範囲内にあるか否かを判断する判断工程と、
    該判断工程で、前記置換候補値が前記範囲内にあると判断した場合、注目サブブロックの直流成分値が前記直前のサブブロックの直流成分値と近似する値を前記置換値として決定し、
    前記判断工程で、前記置換候補値が前記範囲外にあると判断した場合、注目サブブロックが階調属性の画素のみを持つと仮定した場合の前記注目サブブロックの直流成分値に近似させる値を、前記置換値とする決定工程と
    を備えることを特徴とする画像符号化装置の制御方法。
  6. コンピュータが読込み実行することで、コンピュータに請求項1乃至4のいずれか1項に記載の画像処理装置として機能させることを特徴とするコンピュータプログラム。
  7. 請求項6に記載のコンピュータプログラムを格納したことを特徴とするコンピュータ可読記憶媒体。
JP2006286885A 2006-10-20 2006-10-20 画像符号化装置及びその制御方法 Expired - Fee Related JP4743884B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2006286885A JP4743884B2 (ja) 2006-10-20 2006-10-20 画像符号化装置及びその制御方法
US11/862,804 US8041135B2 (en) 2006-10-20 2007-09-27 Image encoding apparatus and control method thereof

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006286885A JP4743884B2 (ja) 2006-10-20 2006-10-20 画像符号化装置及びその制御方法

Publications (3)

Publication Number Publication Date
JP2008104121A true JP2008104121A (ja) 2008-05-01
JP2008104121A5 JP2008104121A5 (ja) 2009-11-19
JP4743884B2 JP4743884B2 (ja) 2011-08-10

Family

ID=39438078

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006286885A Expired - Fee Related JP4743884B2 (ja) 2006-10-20 2006-10-20 画像符号化装置及びその制御方法

Country Status (1)

Country Link
JP (1) JP4743884B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117819160A (zh) * 2024-03-04 2024-04-05 宝鸡杭叉工程机械有限责任公司 基于图像处理的带式输送机煤流自动监测方法及系统

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04326669A (ja) * 1991-04-26 1992-11-16 Canon Inc 画像符号化装置及び画像符号化方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04326669A (ja) * 1991-04-26 1992-11-16 Canon Inc 画像符号化装置及び画像符号化方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117819160A (zh) * 2024-03-04 2024-04-05 宝鸡杭叉工程机械有限责任公司 基于图像处理的带式输送机煤流自动监测方法及系统

Also Published As

Publication number Publication date
JP4743884B2 (ja) 2011-08-10

Similar Documents

Publication Publication Date Title
US7613345B2 (en) Image coding apparatus and image decoding apparatus and their control methods, and computer program and computer-readable storage medium
Celik et al. Reversible data hiding
JP4365957B2 (ja) 画像処理方法及びその装置及び記憶媒体
US6711295B2 (en) Encoding apparatus and method, and storage medium
US8213727B2 (en) Image encoding apparatus and image decoding apparatus, and control method thereof
US20060262982A1 (en) Image encoding apparatus and method, computer program, and computer-readable storage medium
JP2000069292A (ja) 画像処理装置及び方法及び記憶媒体
JP2002325170A (ja) 画像処理装置及びその方法並びにプログラムコード、記憶媒体
JP4956304B2 (ja) 画像符号化装置及びその制御方法、並びに、コンピュータプログラム及びコンピュータ可読記憶媒体
US8041135B2 (en) Image encoding apparatus and control method thereof
JP2008118307A (ja) 符号化装置及びその制御方法
JP2006502604A (ja) 任意形状オブジェクトの画像圧縮方法
JP5101962B2 (ja) 画像符号化装置及びその制御方法並びにコンピュータプログラム
JP2000048036A (ja) 画像処理装置およびその方法
JP2006093958A (ja) プログレッシブjpeg復号化システム
JP4743884B2 (ja) 画像符号化装置及びその制御方法
JP3952116B2 (ja) 画像圧縮装置及び方法
US20110194767A1 (en) Image encoding apparatus and control method therefor
KR20130062108A (ko) 적응적 탬플릿을 이용한 이진 영상의 부호화 방법 및 장치, 그 복호화 방법 및 장치
JP5086777B2 (ja) 画像符号化装置及びその制御方法、コンピュータプログラム並びにコンピュータ可読記憶媒体
JP4743883B2 (ja) 画像符号化装置およびその制御方法
JPH11331852A (ja) 可逆符号化方法および可逆符号化装置
JP2010074444A (ja) 画像圧縮装置、画像圧縮方法、画像復号装置、画像復号方法、及び、コンピュータプログラム
KR20030063850A (ko) 문자와 이미지가 포함된 문서의 압축, 복원 시스템 및방법
JP4971881B2 (ja) 画像符号化装置及び画像復号装置、並びにそれらの制御方法

Legal Events

Date Code Title Description
A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20091002

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20091002

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110314

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110411

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110428

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110509

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140520

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees