JP2008104120A - 画像符号化装置およびその制御方法 - Google Patents

画像符号化装置およびその制御方法 Download PDF

Info

Publication number
JP2008104120A
JP2008104120A JP2006286883A JP2006286883A JP2008104120A JP 2008104120 A JP2008104120 A JP 2008104120A JP 2006286883 A JP2006286883 A JP 2006286883A JP 2006286883 A JP2006286883 A JP 2006286883A JP 2008104120 A JP2008104120 A JP 2008104120A
Authority
JP
Japan
Prior art keywords
value
encoding
pixel
image
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2006286883A
Other languages
English (en)
Other versions
JP2008104120A5 (ja
JP4743883B2 (ja
Inventor
Kenta Takarazaki
健太 寳▲崎▼
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2006286883A priority Critical patent/JP4743883B2/ja
Priority to US11/862,804 priority patent/US8041135B2/en
Publication of JP2008104120A publication Critical patent/JP2008104120A/ja
Publication of JP2008104120A5 publication Critical patent/JP2008104120A5/ja
Application granted granted Critical
Publication of JP4743883B2 publication Critical patent/JP4743883B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Compression Of Band Width Or Redundancy In Fax (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

【課題】 階調画像と文字/線画とが混在した画像をブロック単位に符号する場合に、文字/線画の画素が存在した画素を置き換える置換値を、周波数変換後の直流成分の発生をほぼゼロする値にするので、復号時の画像のブロック歪を最小化する。
【解決手段】 ブロック化部901は、画像データを8×8画素のブロックに入力する。抽出部902は、文字/線画の画素データを抽出色情報として抽出すると共に、文字線画画素位置を特定する位置情報を抽出する。置換部903は、入力したブロックの画像データ中の、文字/線画として抽出した画素データを、階調属性を持つ画素データに基づいて決定される置換値で置換する。このとき、置換部903は、入力したブロックが階調属性の画素のみを持つと仮定した場合の周波数変換の直流成分値に近似する値を、置換値とする。
【選択図】 図9

Description

本発明は、画像データを圧縮符号化する技術に関するものである。
従来、画像を符号化する方法として知られているものとしてJPEGが挙げられる。このJPEG符号化は、画像データ中の8×8画素のブロックを単位に符号化するものである。以下に説明する処理は全てこのブロックを単位として実行するものである。
先ず、入力したブロックに対し、直交変換(DCT;Discrete Cosine Transform)を行い、8×8個の直交変換係数を得る。次に、この直交変換係数に対して、量子化テーブルを用いて量子化を行う。ここで、量子化テーブルの要素の値を量子化ステップ幅と呼ぶ。量子化ステップ幅は、高周波成分の直交変換係数ほど大きい。量子化は、各直交変換係数をそれぞれに対応する量子化ステップ幅で除算し、小数点以下を四捨五入して丸めを行うものである。それ故、量子化後の値は高周波成分ほど小さな値になり、0の発生頻度が高くなる。次に、量子化後の値に対してDC成分(1つ)とAC成分(63個)で別々の符号化を行う。
DC成分に関しては、ブロック間の相関が強いため差分予測符号化を行った後、ハフマン符号化される。差分予測符号化は直前の値との差を符号化する方式である。ハフマン符号化は、発生頻度の高い値には短い符号を、発生頻度の低い値には長い符号を与えることで結果的に全体の符号長を短くする符号化方法である。
AC成分に対しては、ランレングス符号化を行った後、ハフマン符号化を行う。ランレングス符号化は、同一の値が長く続くほど符号化率が向上する符号化方法である。量子化後の値に対してジグザグスキャンを行うことにより、高周波成分の0の値を連続させることで符号化効率を向上させている。
JPEG符号化は、デジタルカメラ等のデバイスに搭載されていることもからもわかるように、自然画像に対しては良好な圧縮方法である。他方、文字や線画などの含まれる画像に対しては、画像の高周波成分が失われることを原因とするモスキートノイズや、直流成分の量子化誤差や高周波成分が失われることを原因とするブロック歪が起こりやすいという問題がある。そのため文字や線画などの解像度が保持したまま圧縮する方法として、画像を直交変換の単位となるブロックに分割する。そして、ブロック単位で予め指定された色若しくは濃度値の文字や線画などの解像情報を抽出し、その抽出した領域に対して適当な値で置換処理を行った階調情報を直交変換等で符号化する。一方、ブロック単位の色情報に対しては予測符号化等で符号化するといった方法が提案されている。
これは、画像を高周波成分の比較的少ない自然画像と、局所的に同一の濃度値を有する2値的な情報である文字や線画を合成したものとして仮定するものである。そして、その画像に対して直交変換符号化を用いて圧縮・伸長する際に発生する信号歪から文字や線画の情報を保護するために、文字・線画の2値情報を予め抽出しておき、2値情報に対しては劣化の生じない可逆符号化を行う。
例えば特許文献1においては、抽出領域への置換処理にて、ブロック内の抽出領域以外の領域を参照して置換処理を行う。具体的には、平均値演算部において抽出領域以外の領域の平均値を算出し、得られた平均値で抽出領域に対して置換処理を行う。あるいは、入力された画素を1サイクル遅延させ、抽出領域の画素に対して、その遅延させた画素で置換を行うという方法が示されている。このような方法で直交変換後のスペクトルを低周波領域に集中させ、圧縮・伸張後の画質劣化を抑える効果を得られる。
特開平4−326669号公報
しかしながら、上記従来の画像処理方法では、直交変換後の量子化の際に用いる量子化ステップ幅が粗いと、量子化誤差が発生する可能性が高く、その量子化誤差が画像のブロック歪を引き起こす原因の一つになっているという問題が残る。
本発明はかかる問題点に鑑みなされたものであり、ブロック歪みの発生を抑制し、階調画像と文字/線画とが混在した画像を効率良く符号化する技術を提供しようとするものである。
この課題を解決するため、例えば本発明の画像処理装置は以下の構成を備える。すなわち、
文字/線画画像データと階調画像データが混在した画像データを符号化する画像処理装置であって、
符号化対象の画像データを、複数の画素で構成されるブロック単位に入力する入力手段と、
入力したブロックの画像データから、文字/線画の画素データと、文字線画の画素データか階調属性の画素データかを識別するための識別情報を抽出する抽出手段と、
該抽出手段で抽出した前記文字/線画画素データを符号化する第1の符号化手段と、
前記抽出手段で抽出した前記識別情報を符号化する第2の符号化手段と、
前記入力したブロックの画像データ中の、文字/線画として抽出した画素データを、階調属性を持つ画素データに基づいて決定される置換値で置換する置換手段と、
該置換手段で置換された後のブロック単位の画像データを周波数変換し、符号化する第3の符号化手段と、
前記第1乃至第3の符号化手段で生成された符号化データを合成し、ブロック単位の符号化データを生成する符号列生成手段とを備え、
前記置換手段は、階調属性の画素のみを持つと仮定した場合の前記周波数変換の直流成分値に近似する値を、前記置換値とすることを特徴とする。
本発明によれば、階調画像と文字/線画とが混在した画像をブロック単位に符号する場合に、文字/線画の画素が存在した画素を置き換える置換値を、周波数変換後の直流成分の発生をほぼゼロする値にするので、ブロック歪を最小化することができる。
以下添付図面に従って本発明に係る実施形態を説明する。
<第1の実施形態>
図9は実施形態における画像圧縮装置のブロック構成図である。図示において、ブロック化部901は、符号化対象の画像データから8×8画素で構成されるブロックを単位に出力する。抽出部902は、ブロック化された画像から、予め定められた方法により抽出色を決定し、出力する。また、抽出部902はブロック内に存在する抽出色の位置を示した情報を、位置情報として出力する。この位置情報は、ブロック内の各画素が、抽出色領域内の画素であるか、非抽出色領域内の画素であるかを示す識別情報とも言える。
置換部903は、入力された位置情報より抽出色領域の画素に対して置換処理を行い、階調情報として出力する。第1の符号化部904は、入力された抽出色情報を可逆圧縮して出力する。第2の符号化部905は、入力された位置情報を可逆圧縮して出力する。第3の符号化部906は、入力された階調情報を非可逆圧縮(実施形態ではJPEG符号化)して出力する。そして、符号列907は、各符号化部で生成された符号化データを結合し、ブロック単位の符号化データ列を生成し、出力する。
説明を簡単なものとするため、本実施形態での符号化対象の画像データは1画素1成分であり、1画素が8ビット(256階調)の画像(グレースケール画像)とする。また、値255は黒、値0は白として説明する。つまり、画素値は濃度を示すとして説明する。ただし、これは一例であって、これに限るものではない。
実施形態における抽出部902について先ず、説明する。
自然画もしくはCGグラデーション画像中に、黒もしくは黒に近い文字線画が存在するとき、そのブロックの濃度のヒストグラムは図10(a)、(b)のようになる。図10(a)は文字線画の濃度が、背景(自然画、CGグラデーション画像)の濃度に対して、十分に異なる値を持っている場合を示している。この状況はちょうど、文字線画が背景画像とはっきりと区別して視認できる状況である。同図(b)は、同図(a)ほどではないが、文字線画と背景とは一応区別できる状況を示している。いずれの場合でも、頻度のピークは2つ現れるので、2つのピーク間の極小値の位置(図10(a)の場合には、2つのピーク間の無頻度の位置でも良い)を閾値として決定する。
抽出部902は、上記のようにして閾値を決定し、閾値を越える値を持つ画素を抽出色を持つ画素として決定する。そして、抽出色を持つ画素位置を特定するため、入力した8×8画素を、決定した閾値で2値化し、これを位置情報として符号化部905、置換部903に出力する。なお、2値化は、閾値を越える画素値は“1”、閾値以下の画素値は“0”とする。図11(a)は、この位置情報を示している。
抽出部902は、8×8画素をラスタースキャンし、位置情報が“1”である入力画素値を順番に抽出して、図11(b)のように一次元に並べ、その画素値を抽出色情報として符号化部904に出力する。
符号化対象の画像データは、イメージスキャナ等で光学的に読取った画像データである場合、読取り精度等に起因して、文字線画の各画素は単一色となるとは限らない。従って、図11(b)に示すように、ある程度ばらついた値となるが、その分散は小さくい。従って、本実施形態では、符号化部904は、例えば予測符号化を利用した可逆符号化を採用する。
なお、イメージスキャナを介在せず、コンピュータからダイレクトに出力された画像データ、或いは、コンピュータからの印刷データに従ってレンダリングした画像を符号化する場合、誤差は発生しないので、文字線画は単一の色となる。従って、このような場合には、閾値を越える画素は全て同じ値を持つので、抽出色情報は1個のデータとなる。この場合、符号化部904はその1個のデータを符号化すればよい。
また、位置情報は、図11(a)に示すように8×8個の2値データであるので、符号化部905は、2値データに特化した可逆符号化(予測符号化、ランレングス符号化等)を行なえばよい。
また、抽出部902は、ブロック内の濃度に対する頻度のピークが1つしか存在しなかった場合、言い替えれば、ブロック内に抽出色の領域が存在しない場合、位置情報の全ビットを“0”として出力する。このとき、抽出部902は、注目ブロック内に抽出色情報無しを示す信号を符号列生成部907に出力する。また、ブロック内に抽出色領域が存在する場合には、抽出色情報有りを示す信号を符号列生成部907に出力する。
一方、実施形態における符号化部906は、JPEG(非可逆)符号化を行なう。JPEG符号化は、デジタルカメラ等に搭載された符号化技術であり、自然画に対して高い圧縮率を有することで知られている。このJPEGは、人間の視覚が高周波成分に対して鈍感であることを利用し、その高周波成分をある程度除去して情報量を少なくしてから、符号化するものである。しかしながら、文字線画等は、そのエッジが鮮明であることが望ましい。言い方を変えれば、文字線画は高周波成分が維持されることが望ましいと言える。
かかる点、本実施形態では、文字線画部分は、符号化部905、904にて可逆符号化されることになり、理論上、完全に元の値に復元できる。
JPEG符号化は、8×8画素ブロックのDCT変換(直交変換)、量子化、エントロピー符号化の処理を経て、符号化データを生成する。文字線画を含むブロックをDCT変換すると、その文字線画の存在によって得られる変換係数に影響が現れる。また、量子化処理では、高周波成分の変換係数ほど大きな量子化ステップで量子化するが、それでも完全に高周波成分をカットするわけにはいかない。もし、高周波成分を完全にカットするほど大きな量子化ステップを用いてしまうと、自然画と言えども画質が劣化したものとなってしまうからである。
そこで、本実施形態では、文字線画が存在するブロックをJPEG符号化する際、そのブロックには文字線画が存在していないのと等価のブロックを生成し、符号化部906でJPEG符号化を行なうようにする。これを実現するのが、図9の置換部903である。
以下、実施形態における置換部903について説明する。
図1は、実施形態における置換部903の詳細ブロック図である。置換部903は、目標値算出部101、係数値算出部102、代表値生成部103、置換候補値算出部104、及び、置換値生成部105で構成される。
目標値算出部101は、1ブロックの画素データと位置情報とをもとに、抽出色を持つ画素を除く画素の値の合計値D、抽出色を持つ画素を除く画素の値の平均値Dave、及び、抽出色として判定された画素の個数Nを算出する。
ここで予め説明しておくが、抽出色と判定された画素の個数Nが0の場合、以下に説明する処理は行なわず、置換生成部105は、入力した画素値をそのまま符号化部906に出力するものである。以下では、Nが0以外である場合の説明である点に注意されたい。また、抽出色と判定された画素数ではなく、非抽出色と判定された画素数でも構わない。「抽出色と判定された画素数=64−非抽出色と判定された画素数」の関係を有し、一方を算出することは、他方を算出することと等価であるからである。
8×8画素内の座標(i,j)の画素の値をXi,jと表わし、8×8個の位置情報をTi,jとする。ここで、Ti,jは、“0”、“1”のいずれかの値である。Ti,j=1の場合、画素Xi,jは抽出色を持つ画素、すなわち、文字線画として判定された画素を意味する。Ti,j=0の場合、画素Xi,jは非抽出色を持つ画素、すなわち、自然画(or背景画像)として判定された画素を意味する。従って、合計値D、平均値Dave、個数Nは次のように算出される。また、i,jは0以上7以下の整数である。
N=ΣΣTi,j
D=ΣΣXi,j×(1−Ti,j
Dave=D/(64−N)
ここでΣΣはi,j=0,1,2,…7の合算を示す。
図2は、目標値算出部101の具体的な処理手順を示すフローチャートである。以下、同図にしたがってその処理手順を説明する。
先ず、ステップS201では、合計値を求める変数Dと個数を求める変数Nをそれぞれ0に初期化する。
次いで、ステップS202において、注目画素が抽出色領域内の画素か否か、すなわち、注目画素が抽出色を持つ画素であるか否かを、位置情報に基づき判定する。注目画素が抽出色領域内の画素であると判定した場合、処理はステップS204にすすみ、変数Nを“1”だけ増加する。一方、注目画素が非抽出色領域の画素であると判定した場合、処理はステップS203に進み、変数Dに注目画素データの値を加算する。
ステップS203またはS204のいずれかの処理を行なうと、処理はステップS205に進み、ブロック内の全画素(64画素)分の処理を行なったか否かを判断する。否の場合には、次の画素の処理を行なうため、ステップS202以降の処理を繰り返す。
また、ステップS205にて、ブロック内の全画素分の処理が行なったと判断した場合、処理はステップS206に進み、上記のようにして求めたD、Nに基づき、非抽出色領域内の画素の平均値Daveを求める。
次に、係数値算出部102について説明する。この係数値算出部102は、目標値算出部101より出力された合計値D、平均値Dave、個数Nに基づき、DCT変換で得られる直流成分であるDC係数を算出する。
一般に、DCT変換は、画素値をXi,j、変換して得られる係数をYu,vとするとき、次の演算を行なう。
u,v=(1/4)α(u)α(v)ΣΣ(Xi,j-128)cos((2i+1)uπ/16)cos((2j+1)vπ/16)
ここで、直流成分DCを求める場合に限ると、u、vは共に“0”となり、α(0)は1/√2である。従って、DCT変換後の直流成分DCは次式(1)となる。
DC=Y0,0=(1/8)ΣΣ(xi,j-128) …(1)
本実施形態の置換部903は、ブロック内の抽出色を持つと判定された画素の値を、非抽出色と判定された画素の平均値Daveを持つように置換する。このため、係数値算出部102は、上記式(1)を、目標値算出部101で算出されたD、Dave、Nを用いて次式(2)のように変形し、仮のDC成分を算出し、代表値生成部103に出力する。
DC={非抽出色領域の画素の合計値+(非抽出色領域の画素の平均値*抽出色領域内の画素数)−128×64}/8
=(D+Dave×N−128×64)/8 …(2)
また、JPEGでは、先に説明したように、DCT変換して得られた各係数を量子化する。ここで、実施形態における符号化部906で行なうDC成分の量子化ステップ値は「16」であるとして説明する。通常、量子化した際、小数点以下の値が発生するので、小数点以下を四捨五入することが行われる。
そこで、本実施形態の代表値生成部103は、係数値算出部102で算出されたDC成分値に「8」(量子化ステップの半分の値)を加算した後、下位4ビットを0にする。この結果、係数値算出部102で算出されたDC成分値を、量子化ステップの整数倍にでき、符号化部906で行われる量子化処理で発生する誤差を実質的に0にする。つまり、代表値生成部103は、係数算出部102で算出されたDC成分値を、量子化ステップの整数倍で、そのDC成分値に近似する値に変換し、その結果を量子化代表値として置換候補地算出部104に出力する。
次に置換候補値算出部104について説明する。
代表値生成部103が生成する量子化代表値をDpと表わす。抽出色領域内の画素の値Zをすると、DpとZは、式(2)を参照すると、次式(3)を満たす必要がある。
Dp=(D+Z×N−128×64)/8 …(3)
この式(3)を逆算すると、抽出色領域の内の画素値Zは次式(4)で求められる。
Z={8×Dp−D−128×64}/N …(4)
={8×量子化代表値−非抽出色領域の画素の合計値−128×64}/抽出色領域と判定された画素数
つまり、抽出色を持つと判定された各画素の値を、式(4)で求めた値にすれば、後段の符号化部906で量子化した際のDC成分に誤差は発生しないことになる。ただし、画素値は整数でなければならない。つまり、このままでは、式(4)による剰余値(余り)が無視されてしまう。
そこで、この剰余値Rを次式(5)で求める(「A % B」は整数Aを整数Bで除算した際の余りを返す関数とする)。
R={8×Dp−D−123×84} % N …(5)
置換候補値算出部104は、剰余値Rと、値Z(候補値)を置換値生成部105に出力する。
置換値生成部105は、位置情報、剰余値R、候補値Zに基づき、入力した1ブロック分の画素データを生成し、符号化部906に出力する。具体的には、置換値生成部105は、位置情報により注目画素が非抽出色領域内にあると判定した場合には、その画素の値をそのまま符号化部906に出力する。また、置換値生成部105は、位置情報により注目画素が抽出色の領域内にあると判定した場合には、候補値Zまたは候補値Z+1の値をその画素の値として符号化部906に出力する。
この置換値生成部105の処理内容の一例を図3のフローチャートに従って説明する。なお、以下の説明における画素位置の更新方向は、ラスタースキャン方向として説明する。
先ず、ステップS301に、カウンタCに初期値として剰余値Rをセットする。
次いで、ステップS302において、注目画素は抽出色領域内にあるか否かを判断する。注目画素が非抽出領域内にあると判定した場合には、ステップS306に進み、入力した画素データをそのまま出力する。
また、ステップS302にて、注目画素は抽出色領域内にあると判断した場合、処理はステップS303に進み、カウンタCが“0”となったか否かを判断する。否の場合には、ステップS304に進む。このステップS305では、入力した注目画素値の代わりに、「Z+1」を出力する。そして、カウンタCを“1”だけ減じる。
ステップS307では、64個の画素データの出力を終えたか否かを判断する。否の場合には、ステップS302に戻る。
上記の処理の結果、抽出色領域内にあると判断し、尚且つ、カウンタCが“0”以外である場合には、ステップS304の処理が行われるが、カウンタCが“0”となった場合、処理はステップS305に進む。このステップS305では、入力した注目画素値の代わりに、候補値Zを出力する。
置換値生成部105による処理内容を、図4を参照して説明する。
図4(a)は、入力したブロックを示している。また、斜線部分は、抽出色領域を示している。同図(b)は、この非抽出領域の画素値から導き出した各値を示している。図示の場合、非抽出領域の画素の平均値Daveは“39.74”、DC成分値は“−708.4”、量子化代表値Dpは“−704”、置換候補値Zは“40”、剰余値Rは“10”であることを示している。
従って、図4(a)における、ラスタスキャンしていって、斜線部の領域内の最初の10個の画素が“41”となり、残りが“40”とすることで、同図(c)の結果を得ることができる。
符号化部906は、この図4(c)のブロックについて非可逆符号化であるJPEG符号化を行なうことになる。
符号列生成部907は、抽出部902から、抽出色情報有りを示す信号を受信した場合、抽出色領域有りを示す識別ビット(例えば“1”)を有するヘッダを生成する。そして符号列生成部907は、そのヘッダと、符号化部904乃至906から出力された抽出色情報符号化データ、位置情報符号化データ、及び、階調符号化データとを結合し、出力する。図12(a)はこの場合の符号化データの構造を示している。
また、符号列生成部907は、抽出部902から、抽出色情報無しを示す信号を受信した場合、抽出色領域無しを示す識別ビット(例えば“0”)を有するヘッダを生成する。そして符号列生成部907は、そのヘッダと、符号化部906から出力された階調符号化データとを結合し、出力する。つまり、位置情報、抽出色情報の符号化データは無視する。図12(b)はこの場合の符号化データの構造を示している。
以上説明したように本第1の実施形態によれば、抽出色領域内の画素が、非抽出色領域の平均値に近い値で置換され、且つ符号化部906内での量子化後のDC係数が量子化代表値と一致する。その結果、DC成分の量子化誤差が0になるため、DC成分の量子化誤差によるブロック歪を最小化することができる。また、DCT変換後の高周波成分の係数値も必然的に小さなものとなる。従って、高い周波数の量子化後の係数は“0”となる確率が高くなり、圧縮率を高めることも可能になる。
なお、上記実施形態では、剰余値Rを振り分ける対象の画素位置を、ラスタースキャン順にする例を説明したが、これに限らない。例えば、図3のフローチャートにおいて、カウンタCに、「抽出色領域の個数N−剰余値R」をセットする。そして、ラスタースキャンに従った最初の「抽出色領域の個数N−剰余値R」個の画素データを候補値Zを出力し、残りのR個の画素データとして「Z+1」を出力しても構わない。
なお、上記の符号化データを復号する装置のブロック構成図を図13に示し、その復号処理の流れを一応説明する。図示に示すように、装置は、符号化用データバッファ501、解析・分離部502、抽出色情報復号部503、位置情報復号部504、階調画像復号部505、及び、画像ブロック生成部506で構成される。
1ブロック分の符号化データが符号化データバッファ501に格納されると、解析・分離部502はの符号化データのヘッダを解析し、その中の識別ビットを判定する。識別ビットが“1”である場合、符号化データは図12(a)の構造であることを意味するので、解析・分離部502は、符号化データ用バッファ501に格納された各符号化データを復号部504乃至506それぞれに分配する。また、このとき、解析・分離部502は識別ビットの情報を画像ブロック生成部506に出力する。この結果、復号部503乃至05は、自身に分配された符号化データの復号処理を行ない、その結果を画像ブロック生成部507に出力する。
また、識別ビット“0”である場合、符号化データは図12(b)の構造であることを意味する。従って、解析・分離部502は、符号化データ用バッファ501に格納された符号化データを階調画像復号部506のみに分配する。また、このとき、解析・分離部502は識別ビットの情報を画像ブロック生成部506に出力することも行なう。
画像ブロック生成部507は、解析・分離部502からの識別ビットが“0”である場合、階調画像復号部505から出力された8×8画素の画像データを、そのまま出力する。また、画像ブロック生成部507は、解析・分離部502からの識別ビットが“1”である場合、位置情報が“0”となっている画素については、階調画像復号部505から出力された画素データを出力する。また、位置情報が“1”である画素については、抽出色情報生成部503で復号された画素データを順番に出力する。
<第2の実施形態>
図5は、第2の実施形態に係わる置換処理の構成を説明するブロック図である。図中、図1と同じ動作を行う部分は同じ番号を付してある。506は振り分け位置判定部、507は置換値生成部である。以下、第1の実施形態と異なる部分のみ説明する。
本第2の実施形態は、剰余値の振り分位置を、抽出色領域の近傍の非抽出色の画素値に基づき決定するものである。
図5の振り分け位置判定部506は、剰余値R、位置情報、画素データを入力し、内部設けられたメモリ内に、後述する「座標、画素データ、連続数」を1レコードとするデータを格納する。
以下、振り分け位置判定部506の処理内容を、図6に示すフローチャートを用いて具体的に説明する。
なお、以下の説明において、注目画素の位置はラスタースキャン順に更新していくものとする。最初の画素(0番目の画素)の直前の画素は存在しないが、その直前の画素は、非抽出色領域の画素として扱うものとする。
先ず、ステップS601では、入力画素が抽出色領域であるか否かを判断する。注目画素が、抽出色領域内にあると判断した場合、処理はステップS602に進み。ステップS602では、直前画素、つまり1サイクル遅延された入力画素が抽出色領域内の画素であるか否かを判断する。
直前画素が非抽出色領域内の画素である場合、注目画素は抽出色領域の境界の画素であることを意味する。それ故、ステップS604にて、注目画素位置、直前の画素の値、及び、連続数“1”で構成される1レコード分のデータをメモリに格納する。
また、ステップS602にて、直前の画素が抽出色領域にあると判断した場合、抽出色領域内の画素が連続していることを示している。それ故、ステップS605にて、メモリに格納された現在のレコードの連続数を“1”だけ増加させる。
ステップS604、S605のいずれかの処理を行なうと、次に、ステップS606にて、注目画素がブロック中の最後の画素となったか否かを判断し、否の場合にはステップS601以降の処理を繰り返す。
ここで、注目ブロックが図8(a)に示すデータであるとする。図示において、斜線部が抽出色領域(位置情報が“1”)である。
ここで、ステップS606にて最後の画素についてのチェックが完了した場合、振り分け位置判定部506内のメモリには、同図(b)に示すように、7レコードのデータが格納される。最初のレコード「15、30、1」は、ブロックをラスタースキャンした際に15番目の画素が抽出色領域であり、その直前の非抽出色領域の画素値は“30”であり、抽出色領域と判定された連続画素数は“1”であることを示している。また、2番目のレコード「22、40、2」は、ブロックをラスタースキャンした際に22番目の画素が抽出色領域であり、その直前の非抽出色領域の画素値は“40”であり、抽出色領域と判定された連続画素数は“2”であることを示している。それ以外については説明するまでもないであろう。
ステップS607では、この7つのレコードの第2フィールド、すなわち、抽出色領域となる画素の直前の画素データをキーにして昇順にソートする。この結果、図8(b)のデータは、同図(c)の様に並べ替えられる。
ステップS608では、振り分け位置判定部506は、自身のメモリ内の1レコード分のデータを入力する。そして、ステップS609にて、置換候補値算出部104からの剰余値Rと、入力した連続数とを比較する。「R≧連続数」であると判断した場合には、ステップS610にて、入力した1レコードの画素位置から連続数で示される画素群を、「+1」の値を振り分る対象として決定する。そして、ステップS611にて、剰余値Rから連続数を減じることで剰余値Rを更新し、ステップS608に戻る。
ステップS609にて、「剰余値R<連続数」であると判定した場合、処理はステップS612に進む。このステップS612では、入力した1レコード中の画素位置から、その時点での剰余値Rで示される個数の画素群を、「+1」の値を振り分る対象として決定する。
以上の結果、置換候補値算出部104からの剰余値Rが“10”であるとき、図8(d)に示すように、「+1」を加算する対象となる10個の画素位置が決定されることになる。従って、図5における置換値生成部507は、位置情報が“0”の画素については、入力した階調画素データをそのまま出力する。また、置換値生成部507は、位置情報が“1”であり、振り分け位置判定部506からの振り分け値が「+1」の画素については、「候補値+1」を出力する。そして、また、置換値生成部507は、位置情報が“1”であり、振り分け位置判定部506からの振り分け値が「+1」以外の画素については、「候補値」を出力する。
図7は、本第2の実施形態における置換値生成部507の処理内容を示してる。
先ず、ステップS701にて、注目画素が抽出色領域内にあるか否かを判断する。否の場合には、ステップS705にて、入力した階調画素の値をそのまま符号化部906に出力する。
また、注目画素が抽出色領域内にあると判定した場合、処理はステップS702に進み、注目画素位置は振り分け対象画素か否かを判断する。否の場合には、ステップS704にて、置換候補値算出部104からの候補値を注目画素の階調画素データとして符号化部906に出力する。
また、ステップS702にて、注目画素位置は振り分け対象画素であると判断した場合には、ステップS703にて、置換候補値算出部104からの「候補値+1」を注目画素の階調画素データとして符号化部906に出力する。
以上の結果、剰余値を振り分ける対象画素は、その近傍の階調値の大きい画素の近傍にの集中することになる。これによって抽出色領域と非抽出色領域の領域の境界が滑らかになり、DCT変換後のブロックの高周波成分の係数の発生を更に下げることが可能となる。すなわち、量子化後の係数が“0”か、それに近い値となる確率を高め、圧縮符号化率を高めることが可能になる。
また、上記手法に限らず、例えば、先ず、抽出色領域を非抽出色領域の平均値で埋めた後、抽出色領域を差分値でソーティングし、差分が小さくなる抽出色画素の内、最も差分が大きい画素に上記剰余が振り分ける。この操作を上記剰余が0になるまで繰り返す手法でも良い。
以上、本発明に係る実施形態を説明したが、CPUやMPU等のプロセッサがコンピュータプログラムを実行することで、図9に係る構成の機能を実現しても構わない。すなわち、本発明は、コンピュータプログラムをもその範疇とする。また、通常、コンピュータプログラムは、CD−ROM等のコンピュータ可読記憶媒体に格納されている。そして、そのコンピュータ可読記憶媒体を、読取り装置(CD−ROMドライブ)にセットし、システムにコピーもしくはインストールすることで実行可能となる。従って、このようなコンピュータ可読記憶媒体も本発明の範疇にあることも明らかである。
第1実施形態に係る置換部のブロック構成図である。 第1実施形態の目標値算出部の処理内容を説明するためのフローチャートである。 第1実施形態の置換値生成部の処理内容を説明するためのフローチャートである。 置換値生成部の処理内容の例を示す図である。 第2実施形態に係る置換部のブロック構成図である。 第2実施形態の振り分け位置判定部における処理内容を説明するためのフローチャートである。 第2実施形態の置換値生成部における置換値生成部の処理内容を説明するためのフローチャートである。 第2の実施形態における振り分け位置決定部506の処理内容の一例を示す図である。 本実施形態の画像符号化装置のブロック構成図である。 図9の抽出部の処理内容を説明するための図である。 図9の抽出部が生成する位置情報、及び、抽出色情報の一例を示す図である。 図9の符号列生成部が生成する1ブロック分の符号化データの構造を示す図である。 実施形態における画像復号装置のブロック構成図である。

Claims (7)

  1. 文字/線画画像データと階調画像データが混在した画像データを符号化する画像符号化装置であって、
    符号化対象の画像データを、複数の画素で構成されるブロック単位に入力する入力手段と、
    入力したブロックの画像データから、文字/線画の画素データと、文字線画の画素データか階調属性の画素データかを識別するための識別情報を抽出する抽出手段と、
    該抽出手段で抽出した前記文字/線画画素データを符号化する第1の符号化手段と、
    前記抽出手段で抽出した前記識別情報を符号化する第2の符号化手段と、
    前記入力したブロックの画像データ中の、文字/線画として抽出した画素データを、階調属性を持つ画素データに基づいて決定される置換値で置換する置換手段と、
    該置換手段で置換された後のブロック単位の画像データを周波数変換し、符号化する第3の符号化手段と、
    前記第1乃至第3の符号化手段で生成された符号化データを合成し、ブロック単位の符号化データを生成する符号列生成手段とを備え、
    前記置換手段は、階調属性の画素のみを持つと仮定した場合の前記周波数変換の直流成分値に近似する値を、前記置換値とすることを特徴とする画像符号化装置。
  2. 第1、第2の符号化手段は可逆符号化手段であり、前記第3の符号化手段は非可逆のJPEG符号化手段であって、
    1ブロック内の文字線画の属性を持つ画素の個数をN、階調属性を持つ画素データの総和、及び、その平均値をD,Daveとしたとき、
    前記置換手段は、DCT変換時に算出される直流成分DCを、次式によって求め、
    DC=(D+Dave×N−128×64)/8
    前記第3の符号化手段における直流成分を量子化する際に用いる量子化ステップQの整数倍で、且つ、前記算出した直流成分DCに近似する値Dpと定義したとき、次式に従って前記置換値Zを求める
    Z=(8×Dp−D+128×64)/N
    ことを特徴とする請求項1に記載の画像符号化装置。
  3. 更に、前記置換手段は、前記置換値Zを求める際に発生した剰余値Rを次式に従って求め、
    R=(8×Dp−D+128×64) % N
    (A%Bは整数Aを整数Bで除算した際の余りを返す関数)
    前記文字線画として判定された「N−R」個の画素のデータを置換値Zで置換し、
    前記文字線画として判定されたR個の画素のデータを「Z+1」で置換する
    ことを特徴とする請求項2に記載の画像符号化装置。
  4. 前記「Z+1」を置換する画素位置は、値の大きい階調属性を持つ画素に近い画素位置とすることを特徴とする請求項3に記載の画像符号化装置。
  5. 文字/線画画像データと階調画像データが混在した画像データを符号化する画像符号化装置の制御方法であって、
    符号化対象の画像データを、複数の画素で構成されるブロック単位に入力する入力工程と、
    入力したブロックの画像データから、文字/線画の画素データと、文字線画の画素データか階調属性の画素データかを識別するための識別情報を抽出する抽出工程と、
    該抽出工程で抽出した前記文字/線画画素データを符号化する第1の符号化工程と、
    前記抽出工程で抽出した前記識別情報を符号化する第2の符号化工程と、
    前記入力したブロックの画像データ中の、文字/線画として抽出した画素データを、階調属性を持つ画素データに基づいて決定される置換値で置換する置換工程と、
    該置換工程で置換された後のブロック単位の画像データを周波数変換し、符号化する第3の符号化工程と、
    前記第1乃至第3の符号化工程で生成された符号化データを合成し、ブロック単位の符号化データを生成する符号列生成工程とを備え、
    前記置換工程は、階調属性の画素のみを持つと仮定した場合の前記周波数変換の直流成分値に近似する値を、前記置換値とすることを特徴とする画像符号化装置の制御方法。
  6. コンピュータが読込み実行することで、コンピュータに請求項1乃至4のいずれか1項に記載の画像符号化装置として機能させることを特徴とするコンピュータプログラム。
  7. 請求項6に記載のコンピュータプログラムを格納したことを特徴とするコンピュータ可読記憶媒体。
JP2006286883A 2006-10-20 2006-10-20 画像符号化装置およびその制御方法 Expired - Fee Related JP4743883B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2006286883A JP4743883B2 (ja) 2006-10-20 2006-10-20 画像符号化装置およびその制御方法
US11/862,804 US8041135B2 (en) 2006-10-20 2007-09-27 Image encoding apparatus and control method thereof

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006286883A JP4743883B2 (ja) 2006-10-20 2006-10-20 画像符号化装置およびその制御方法

Publications (3)

Publication Number Publication Date
JP2008104120A true JP2008104120A (ja) 2008-05-01
JP2008104120A5 JP2008104120A5 (ja) 2009-11-19
JP4743883B2 JP4743883B2 (ja) 2011-08-10

Family

ID=39438077

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006286883A Expired - Fee Related JP4743883B2 (ja) 2006-10-20 2006-10-20 画像符号化装置およびその制御方法

Country Status (1)

Country Link
JP (1) JP4743883B2 (ja)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04326669A (ja) * 1991-04-26 1992-11-16 Canon Inc 画像符号化装置及び画像符号化方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04326669A (ja) * 1991-04-26 1992-11-16 Canon Inc 画像符号化装置及び画像符号化方法

Also Published As

Publication number Publication date
JP4743883B2 (ja) 2011-08-10

Similar Documents

Publication Publication Date Title
Celik et al. Reversible data hiding
JP4365957B2 (ja) 画像処理方法及びその装置及び記憶媒体
US8270716B2 (en) Selectively compressing picture and text areas of an image to maintain highest quality and effective compaction
US7903888B2 (en) Image encoding apparatus and image decoding apparatus
JP4956304B2 (ja) 画像符号化装置及びその制御方法、並びに、コンピュータプログラム及びコンピュータ可読記憶媒体
US8213727B2 (en) Image encoding apparatus and image decoding apparatus, and control method thereof
RU2567988C2 (ru) Кодер, способ кодирования данных, декодер, способ декодирования данных, система передачи данных, способ передачи данных и программный продукт
JP2002325170A (ja) 画像処理装置及びその方法並びにプログラムコード、記憶媒体
US8041135B2 (en) Image encoding apparatus and control method thereof
JP5101962B2 (ja) 画像符号化装置及びその制御方法並びにコンピュータプログラム
US8023756B2 (en) Image encoding apparatus and method of controlling same
JPH11168632A (ja) ディザ画像の2値表現処理方法、ディザ画像の圧縮2値表現圧縮解除方法、及びディザ画像の圧縮及び圧縮解除システム
JP4743883B2 (ja) 画像符号化装置およびその制御方法
JP4743884B2 (ja) 画像符号化装置及びその制御方法
US20110194767A1 (en) Image encoding apparatus and control method therefor
KR20130062108A (ko) 적응적 탬플릿을 이용한 이진 영상의 부호화 방법 및 장치, 그 복호화 방법 및 장치
KR100412176B1 (ko) 문자와 이미지가 포함된 문서의 압축, 복원 시스템 및방법
JP5086777B2 (ja) 画像符号化装置及びその制御方法、コンピュータプログラム並びにコンピュータ可読記憶媒体
JPH11331852A (ja) 可逆符号化方法および可逆符号化装置
JP2010074444A (ja) 画像圧縮装置、画像圧縮方法、画像復号装置、画像復号方法、及び、コンピュータプログラム
JP4971881B2 (ja) 画像符号化装置及び画像復号装置、並びにそれらの制御方法
JP2009260747A (ja) 画像符号化装置及びその制御方法
JP4757172B2 (ja) 画像符号化装置及びその制御方法
JPH05235778A (ja) 高能率符号化方法
JP4944833B2 (ja) 画像符号化装置及びその制御方法

Legal Events

Date Code Title Description
A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20091002

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20091002

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110314

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110411

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110428

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110509

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140520

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees