JP5597028B2 - 画像復号装置及びその制御方法、並びにプログラム及びコンピュータ可読記憶媒体 - Google Patents

画像復号装置及びその制御方法、並びにプログラム及びコンピュータ可読記憶媒体 Download PDF

Info

Publication number
JP5597028B2
JP5597028B2 JP2010113421A JP2010113421A JP5597028B2 JP 5597028 B2 JP5597028 B2 JP 5597028B2 JP 2010113421 A JP2010113421 A JP 2010113421A JP 2010113421 A JP2010113421 A JP 2010113421A JP 5597028 B2 JP5597028 B2 JP 5597028B2
Authority
JP
Japan
Prior art keywords
pixel
pixels
image data
gradation
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2010113421A
Other languages
English (en)
Other versions
JP2011244152A5 (ja
JP2011244152A (ja
Inventor
健太 寳▲崎▼
尚 石川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2010113421A priority Critical patent/JP5597028B2/ja
Publication of JP2011244152A publication Critical patent/JP2011244152A/ja
Publication of JP2011244152A5 publication Critical patent/JP2011244152A5/ja
Application granted granted Critical
Publication of JP5597028B2 publication Critical patent/JP5597028B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression Of Band Width Or Redundancy In Fax (AREA)

Description

本発明は画像の復号技術に関するものである。
従来、画像を圧縮する手法の1つとして、ブロック符号化が知られている。通常のブロック符号化は、画像を小ブロックに分割して符号化するものであるが、ブロック毎の符号量がマチマチであったり、復号時に他のブロック情報が必要であったりしており、圧縮した状態での編集処理が不可能であった。この課題を解決する手法として、特許文献1では、ブロック単独での復号が可能で、かつ、ブロック単位の符号量を一定にする固定長符号化が提案されている。
この特許文献1では、ブロック内の画像を文字や線画等のエッジの鮮明さが重要な部分(以下、単に文字線画という)と、自然画などの階調性が重要な部分(以下、階調画像という)に分離し、それぞれ別の符号化方式で圧縮するというものである。また、階調画像の部分は、その圧縮率を更に上げるため、ブロックの水平、垂直方向のサイズを1/2に縮小して符号化している。復号して得られた階調画像を、水平、垂直ともオリジナルのブロック画像の水平、垂直とも1/2のサイズであるので、それぞれ2倍に拡大して元の大きさに戻し、復号した文字線画と合成してブロック画像を復元する、というものである。
ここで用いられる縮小と拡大の方法としては、既に多くの手法が提案されている。例えば、縮小方法としては特許文献2に示すような2×2画素の平均値を、縮小後の1画素の値とする方法などが用いられていた。一方、拡大方法としては、一般的には公知の最近傍法や線形補間法などが用いられていた。
特開2008−278042号公報 特開2009−77177号公報
しかしながら、階調画像と言えども、濃度や輝度の急峻に変化する部分が重要なものも存在する。この場合、従来通りの拡大処理を行ってしまうと、本来、濃度や輝度が急峻であるべき箇所が、スムージングされ、元々存在していた模様などがぼけてしまうという問題があった。例えば、前述したような画素平均による縮小と、最近傍法による拡大の組み合わせでは本来2×2画素の画像内に存在したエッジは2×2画素の単一色の画素になってしまい再現することが出来ない。このように非抽出部による画像のぼやけにより、復号画像の品質劣化が検知されてしまう場合があるという問題があった。
本発明ではかかる問題に対して、上記のような符号化データを復号しつつも、オリジナル階調画像のエッジ部分を、これまで以上に再現し得る復号技術を提供しようとするものである。
かかる課題を解決するため、たとえば本発明の画像復号装置は以下の構成を備える。すなわち、
M×N画素で構成されるブロックを単位とする符号化データから、階調画像データを復号する画像復号装置であって、
符号化データを前記ブロックを単位に入力する入力手段と、
入力した1ブロック分の符号化データから、当該符号化データを構成する、(1)当該ブロックに含まれる文字線画の画素値、(2)前記ブロック内の各画素が文字線画、非文字線画のいずれに属するかを示す識別情報の符号化データ、並びに、(3)前記ブロックのサイズよりも小さい、m×n画素(m<M、n<N)で表わされる階調画像データの符号化データを分離する分離手段と、
前記識別情報の符号化データを復号する識別情報復号手段と、
前記階調画像データの符号化データを復号する階調データ復号手段と、
該階調データ復号手段で得られた、前記m×n画素で表わされる階調画像データ中の1画素から(M/m)×(N/n)個の画素を生成することを繰り返すことで、前記m×n画素で表わされる階調画像データから、前記M×N画素で表わされる前記ブロックのサイズの階調画像データを生成する拡大手段と、
前記識別情報復号手段で得られた識別情報に従って、前記拡大手段で得られた前記ブロックの中の着目画素が文字線画、非文字線画のいずれに属するか否かを判定し、前記着目画素が非文字線画に属すると判定された場合には、前記拡大手段で得られた階調画像データ中の前記着目画素の位置の画素値を出力し、前記着目画素が前記文字線画に属すると判定した場合には前記分離手段で分離した文字線画の画素値を出力する画像合成手段とを備え、
前記拡大手段は、
前記階調データ復号手段で得られた、前記m×n画素の階調画像データから、当該階調画像データの画素値の取り得る範囲内にあって、代表となる2つの画素値C0、C1(C0≦C1)を算出する算出手段と、
前記m×n画素の階調画像データ中の着目画素から生成しようとする(M/m)×(N/n)個の画素の中の、非文字線画に属する画素数Lを、前記識別情報を用いて判定する判定手段と、
前記m×n画素の階調画像データ中の前記着目画素の画素値に従って、前記非文字線画に属するL個の画素のうち、L1(0≦L1≦L)で示される個数の画素が画素値C1を持ち、L0(=L−L1)で示される個数の画素が画素値C0を持つように設定する設定手段とを備え、
該設定手段は、前記画素値C0、C1を両端とする数直線上の、前記着目画素の画素値で内分する位置に基づいて、前記L0、L1を決定することを特徴とする。
本発明によれば、オリジナル階調画像のエッジ部分を、これまで以上に再現することが可能になる。
第1の実施形態に係る画像復号化装置のブロック構成図。 第2の実施形態に係る画像符号化装置のブロック構成図。 第2の実施形態に係る画像復号化装置のブロック構成図。 固定長符号のデータフォーマットを示す図。 拡大の手順を示すフローチャート。 拡大処理における画素位置関係を示す図。 拡大処理の動作説明図。 符号化処理の概要を示す図。 画素値C0、C1を持つ画素数を決定する原理を示す図。
以下、添付図面に従って本発明に係る実施形態を詳細に説明する。
[第1の実施形態]
先ず、本第1の実施形態における復号に係る構成並びにその処理を説明する前に、符号化装置における符号化の概要を説明する。ここでは、符号化装置としてデジタルカメラを例にして説明する。また、説明を簡単にするため、対象とする画像がモノクロ画像(色成分の数が1つ)とし、図8における画像800がデジタルカメラで撮影した画像を示している。画像800には、撮影日を示す文字画像が、撮影したタイミングで階調画像に合成されている。さて、この画像を符号化する場合、16×16画素で構成されるブロックを単位に符号化していく。ここで、画像800における文字線画の一部(文字線画画素群802)を包含するブロック801を符号化する場合を考察する。この場合、デジタルカメラの内部のプロセッサは、着目ブロックにおける文字線画の画素の色を抽出し、且つ、各画素毎に、それが文字線画の画素か非文字線画の画素か(抽出色の画素か、非抽出色の画素か)を示す識別情報を生成する。文字線画、階調画像のいずれに属するのかが識別できれば良いので、識別情報を構成する各画素に対応するエレメントは1ビットで良い。図示の場合、1つのブロックは16×16画素で構成されいるので、識別情報は16×16ビットで良いことになる。図示の参照符号803が、この識別情報である。識別情報803に対しては、上記から明らかなように、可逆符号化を行う。可逆符号化としては、ランレングス符号化が好適である。なお、オリジナルのブロック内の文字線画画素群802を復元するためには、識別情報803に加えて、文字線画画素群802の色を示す情報があればよい。すなわち、識別情報のエレメントが“1”の画素を、その色の値で置換すれば、元の文字画素とその色が復元できる。
階調画像に適した符号化として、非可逆のJPEGが知られている。しかし、JPEGでは、符号化しようとする画像に高周波成分が多く含まれている場合、その符号化効率が悪くなる。ここで、ブロック801に着目すると、直交変換にて高周波成分データの要因となる文字線画画素群802が含まれるので、ブロック801をそのままJPEG符号化しても高い圧縮率は望めない。そこで、この文字線画画素群802を構成する各画素の値を、非文字線画の画素の平均値で置換した画素群805を生成し、それを含むブロック804を生成する。このブロック804をJPEG符号化しても良いが、更に圧縮率を高めるため、ブロック804における2×2画素を単位とし、その平均値を算出し、算出した平均値が1つの画素の値として扱うことで、8×8画素で構成される小ブロック806を生成する。この小ブロック806に対して、JPEG符号化を行う。
上記は、オリジナルの16×16画素のブロック内に、文字線画画素群802が存在する場合であったが、ブロック内に文字線画が存在しない場合には、1ブロックの符号化データには、識別情報、文字の色の符号化データは不要であり、そのブロックを水平、垂直とも1/2にした画像に対してJPEG符号化データがあれば良い。ただし、各ブロックの符号化データが、いずれのモードであるのかを判別できないと、正しい復号処理が行えないので、1ブロックの符号化データの先頭には1ビットのモード情報を付加する。
図4(a)は、文字線画画素群を内包しないブロックの符号化データのデータ構造を示し、同図(b)は文字線画画素を内包するブロックの符号化データのデータ構造を示している。
なお、上記ではブロックのサイズを16×16画素とし、階調画像に対する縮小率は水平、垂直とも1/2としたが、これらは一例である。例えば、ブロックのサイズや縮小率に関する情報は、符号化データファイルのヘッダ部に格納しておき、それに従って復号するようにすればよいであろう。例えば、1ブロックのサイズとして、24×24画素とし、水平、垂直とも1/3や1/2倍にしても構わない。
以上、本第1の実施形態における画像復号装置が復号する対象の符号化データの構造について説明した。次に、実施形態における画像復号装置について説明する。
図1は、第1の実施形態の画像復号装置のブロック図である。図示において、アンパック部101は、1ブロック分の符号化データを入力し、先頭のモード情報から、入力した符号化データが図4(a)、(b)のいずれの符号化データであるかを判定する。そして、図4(b)のデータ構造の符号化データであると判断した場合、アンパック部101は入力された1ブロック分の符号化データから、色データ、識別情報の符号化データ、及び、階調画像の符号化データとを分離し、色データを画像合成部105に、識別情報の符号化データを識別情報復号部102に、階調画像の符号化データを階調データ復号部103にそれぞれ出力する。
なお、入力した1ブロックの符号化データが、図4(a)のデータ構造であった場合、アンパック部101は、予め用意した、ブロック内の全画素が非文字線画であることを示す識別情報の符号化データを識別情報復号部102に出力し、モード情報に後続する全符号化データを階調データ復号部103に出力する。このとき、アンパック部101は色データを出力してもしなくても構わない。図4(a)のデータ構造の場合、画像合成部105はその色データを無視するからである。
識別情報復号部102は、分離された識別情報を復号(ランレングス復号)し出力する。また、階調データ復号部103は、分離された階調データを復号(JPEG復号)し、その結果(8×8画素)を出力する。拡大部104は入力された階調データを拡大して原画像の1ブロック(16×16画素)の解像度に戻し出力する。合成部105は、入力された色データ、識別情報、拡大後の階調画像データに基づき、16×16画素の1ブロック分の階調画像を生成し出力する。
識別情報復号部102は入力された圧縮データに対して、可逆の復号処理(ランレングス復号)を行い、16×16画素分の識別情報を復号し、その結果を、画像合成部105、及び、拡大部104に出力する。識別情報は先に説明したように、16×16ビットで構成され、1ビットが1画素に対応し、その値が“1”の場合、その画素が文字線画の画素、すなわち、抽出色の画素を示す。また、“0”の場合、その画素が非文字線画(階調画像)の画素、すなわち、非抽出色の画素を示す。
階調データ復号部103は、入力された階調画像の符号化データに対して復号処理(JPEG復号)を行い、8×8画素の多値の階調画像データを出力する。
拡大部104は、階調データ復号部103より入力された階調画像データを拡大する処理を行う。この拡大部104の拡大の処理手順を示すのが図5のフローチャートであり、図6はその説明のための図である。以下、図5、図6を用いて、実施形態における拡大部104の処理内容を説明する。

まず、S1において、拡大部104は、入力された8×8画素の階調画像データの中から画素値の最小値と最大値を探して記憶する。ここで、得られた最小値をC0、最大値をC1とする。図6の点線太枠601は、着目している8×8画素の画像データを示している。図示の如く、各画素は「行、列」で特定され、画素「00」から画素「77」までが入力画素であり、その中から画素値の最小値C0と最大値C1を探す(C0≦C1の関係にある)。尚、ここでは最小値と最大値としたが、特にそれらに限る必要は無く、C0とC1は非抽出画素の中の小さい値と大きい値を代表する値であればよい。例えば点線太枠601内部の多値データの平均値を求め、平均値未満の画素群の平均値をC0、平均値以上の画素群の平均値をC1としても良い。
次いで、S2にて、拡大部104は、復号して得られた多値画像データ中の1画素を、2×2画素(以下、小画素という)に分割する。図6には画素「22」(図中には明示していない、画素21と画素23に挟まれた画素)を、2×2に区切られている様子を示している。そして、拡大部104は、それら2×2の小画素中、幾つの小画素の画素値をC0とし、幾つをC1とするかを決定する。以下にその具体例を示す。
先ず、拡大部104は、復号した8×8個の階調画像データ中の1つの画素に着目し、着目画素に幾つの非抽出画素が存在するか(幾つの非文字線画の画素が存在するか)を、識別情報復号部102からの識別情報に基づき判定する。ここで、8×8個の階調画像データ中の着目画素をP(x,y)(x,y=0,1,…,7のいずれか)とし、識別情報復号部102で復号された座標(i,j)(i,j=0,1,2,…15)の識別情報のエレメントをI(i,j)と表わしたとき、着目画素P(x,y)に、存在する抽出画素の個数Jは、次の通りである。
J={I(2x,2y) + I(2x+1,2y) + I(2x,2y+1) + I(2x+1,2y+1)}
着目画素P(x,y)には最大で4つの抽出画素(文字線画)が存在し得るので、着目画素に含まれる非抽出画素数Lは、L=4−Jで求められる。すなわち、着目画素に含まれる非抽出画素の個数Lは0乃至4の範囲内の値となる。そして、着目画素P(x,y)の画素値をImと表わしたとき、画素値C0の個数L0、画素値C1の個数L1を次の様にして決定した。
(i)非抽出画素の個数L=0の場合:
L0=L1=0
(ii)非抽出画素の個数L=1の場合:
(ii-1) Im<(C0+C1)/2の場合:
L0=1、L1=0
(ii-2) (C0+C1)/2≦Imの場合:
L0=0、L1=1
(iii)非抽出画素の個数L=2の場合:
(iii-1) Im<(2×C0+C1)/3の場合:
L0=2、L1=0
(iii-2) (2×C0+C1)/3≦Im<(C0+2×C1)/3の場合:
L0=1、L1=1
(iii-3) (C0+2×C1)/3≦Im
L0=0、L1=2
(iv)非抽出画素の個数L=3の場合:
(iv-1) Im<(3×C0+C1)/4の場合:
L0=3、L1=0
(iv-2) (3×C0+C1)/4≦Im<(C0+C1)/2の場合:
L0=2、L1=1
(iv-3) (C0+C1)/2≦Im<(C0+3×C1)/4の場合:
L0=1、L1=2
(iv-4) (C0+3×C1)/4≦Imの場合:
L0=0、L1=3
(v)非抽出画素の個数L=4の場合:
(v-1) Im<(4×C0+C1)/5の場合:
L0=4、L1=0
(v-2) (4×C0+C1)/5≦Im<(3×C0+2×C1)/5の場合:
L0=3、L1=1
(v-3) (3×C0+2×C1)/5≦Im<(2×C0+3×C1)/5の場合:
L0=2、L1=2
(v-4) (2×C0+3×C1)/5≦Im<(C0+4×C1)/5の場合:
L0=1、L1=3
(v-5) (C0+4×C1)/5≦Imの場合:
L0=0、L1=4
上記のようにして、着目画素P(x、y)における画素値C0、C1を持つ小画素の個数L0、L1を決定すると、拡大部104は、非文字線画として生成すべきL個の画素中の、L0個の画素の値をC0、L1個の画素の値をC1にする。上記の如く、着目画素P(x,y)の画素値Imが大きければ大きい程、大きな画素値であるC1を持つ小画素の個数L1が大きな値となり、画素値Imの値が小さいほど、小画素の個数L1が少なくなる。
上記を数学的に示すのであれば、図9に示す通りである。図素の如く、画素値C0、C1を両端とする数直線を考察する。そして、今、非抽出画素の個数Lが仮に「2」であった場合、それに1を加算した数“3”で、その数直線を等分割する。ここで、各分割区間について、画素値C0、C1の個数L0、L1を、図示の様に様に割り当てる。そして、前記着目画素の画素値Imで、その数直線上を内分する位置に基づいて、L0、L1を決定する。図示の場合、画素値Imは、一番右端の領域に属するので、C1の個数L1が“2”、C0の個数が“0”として決定できる。
さて、S3では、拡大部104は、画素値C0、C1を持つ小画素の配置位置を決定する。決定方法として、非抽出画素の位置であって、且つ着目画素に隣接する画素の合計値が大きい順にL1個の画素の画素値をC1に設定し、残ったL0個の画素の画素値をC0に設定する。
S2と同様に図6の2行、2列目の画素「22」を例にして説明する。まず、黒く塗りつぶした小画素を着目小画素とし、それが非抽出画素(非文字線画の画素)であるとする。この場合、着目小画素に隣接する3つの画素の画素値を加算して指標値を得る。図6では、かぎ型の太枠602で囲まれた画素「11」と画素「12」と画素「21」の3画素の画素値を加算する。なお、着目小画素が画素「00」や画素「01」のようにブロックの端に存在する場合は、図示の如く、図6のように端の画素をブロックの境界で折り返して参照画素とする(同じ番号の画素は同じ値の画素であることを示す)。次に、着目小画素を2×2の小領域の右上の画素にして同じように指標値を計算する。着目画素が右上の場合、参照画素は画素「12」と画素「13」と画素「23」となる。小領域内の全ての非抽出画素に関して指標値を計算し、指標値の大きい位置から順番に、ステップS2で決めたC1の個数だけ、画素値C1を持つ小画素を配置していき、残った位置の画素値をC0とする。指標値が等しい画素の個数がC1の残り個数より大きくなった場合は、左上を最も優先度を高くし、以下順に右上・左下・右下の順に優先度を下げていく。なお、小領域内の抽出画素に関しては、次の画像合成部にて上書きされるため、どんな値にしても良い。この決定作業を点線太枠601内の全画素に対して行うことで、16×16個の小画素で構成される画像、すなわち、オリジナルの階調画像データが生成され、合成部105に出力される。
具体例を図7に示す。図7(a)は、図6の画素「01」の位置を中心とする周囲の3×3画素をピックアップした図である。点線太線は、図6における点線太枠601を表しており、括弧内の数字は画素値を表している。図7(b)は、識別情報を表しており、斜線部分が“1”の画素位置(抽出色画素=文字線画の画素)、空白部分が“0”(非抽出色画素=非文字線画の画素)を示している。
ステップS1の結果、仮に、(C0,C1)=(30,70)が得られたと仮定して、着目画素「01」の位置についてステップS2から説明する。識別情報における画素「01」に対するエレメントを参照すると、図7(b)より非抽出画素の個数M=3が得られる。よってステップS2の説明で記載した場合分けの(iv)が該当する。次に、図7(a)よりIm=52なので、3つめの不等式(iv-3)が成立し、画素値C0を持つ小画素数が1、画素値C1を持つ小画素数が2という結果が得られる。
次に、ステップS3の具体例を説明する。まず、2×2個の小画素領域のうち、左上を着目小画素とすると、指標値は50+52+50で計算でき、152が得られる。同様に右上の指標値は52+53+53=158、左下は50+46+48=144である。右下は抽出画素なので、計算する必要はない。従って、ステップS2で、C1が2個と決定しているので、最も大きな指標値である右上と2番目に大きい左上に小画素の値をC1とし、最小である左下に小画素の画素値をC0とする。最終的に図7(c)のような拡大画像が得られる。ただし、図7(c)は画素「01」の位置だけ計算した図であり、*は抽出画素であり、次に説明する合成部105で抽出色データに置き換えられるので、画素値は何を与えても良い。
合成部105では、入力された識別情報(16×16個のエレメントで構成される)と拡大後の階調画像データ(16×16画素)をもとにブロック画像を生成して出力する。ここでは、識別情報、階調画像ともラスタースキャン順に、合成処理を行うものとする。識別情報のエレメントの値が“1”の時、その画素は抽出画素を示すので、合成部105はアンパック部101から供給された色データの値(文字線画の色)を選択し、出力する。一方、識別情報のエレメントの値が“0”の時、その画素は非抽出画素を示すので、拡大部104から出力された、該当する画素値を選択し、出力する。
以上のように第1の実施形態に示した拡大方法によれば、符号化時の縮小処理においてぼけてしまった原画像の非抽出画素に存在したエッジなどを、復号時の拡大処理で復元することができ、画質の劣化を防ぐことが可能となる。
[第2の実施形態]
第2の実施形態では、ブロック画像内に存在する色数に応じて拡大方法を選択する例を説明する。着目ブロック内の非抽出画素に存在する色数が2色以上Th色未満であることを条件とし、この条件に該当する場合にのみ第1の実施形態に示した拡大方法を適用する。即ち、非抽出画素の階調性が低い(色数が少ない)場合(解像性が重要な場合)は、エッジの再現を目的として第1の実施形態に記した拡大方法を用い、階調性が高い場合(色数が多い=階調性が重要な場合)は通常の拡大を行うというものである。なお、条件として、「2色以上」としたのは、1色では非抽出画素にエッジが存在しないためである。ただし、1色の場合、すなわち、着目ブロック内の全非抽出画素が同じ色の場合には、復号化時にC0=C1となり、自動的に一色のみで再現されるので、「2色以上」を条件から外しても構わない。すなわち、Th色未満かどうかで拡大法を決定しても構わない。また、Thを大きくしすぎると非抽出画素が高階調である時に階調性が失われる場合がある。閾値Thとしては、通常は、3あるいは4程度の値にしておくのが適当ではある。
第2の実施形態における1ブロックの符号化データのデータ構造は、図4(a)、(c)の2種類となる。同図(a)は、第1の実施形態と同じ意味である。図4(c)は、抽出色画素が存在した場合の符号化データのデータ構造を示している。図4(b)と比較して、モードデータの次の1ビットに、そのブロック内の非抽出画素に存在する色数が閾値Th色未満(或いは2色以上Th色未満)であるか否かを示すビットを割り当てた(満たしている場合には“1”、満たしていない場合には“0”とする)。
図2に、本第2の実施形態における画像符号化装置の構成例を示す。抽出部201は入力されたブロック画像(16×16画素とする)から、文字線画の画素の色を抽出して色データとしてパック部207に出力する。また、抽出部201は、各画素毎に、その画素が文字線画画素/非文字線画画素(或いは、抽出色画素/非抽出色画素)のいずれであるかを示すデータを生成し、16×16画素分のデータを識別情報として識別情報符号化部203に出力する。色数判定部202は入力されたブロック画像の非抽出画素に含まれる色数を計数し、その色数が閾値Th未満であるか否かを示す1ビットのデータを色数データ(図4(c)参照)としてパック部207に出力する。識別情報符号化部203は抽出部201から出力された識別情報(16×16ビット)を可逆符号化(ランレングス符号化が効果的である)し、その符号化結果をパック部207に出力する。置換部204は、抽出部201からの識別情報に基づき、非文字線画(非抽出色画素)の平均値を算出する。そして、置換部204は、非文字線画画素についてはそのまま通過させ、文字線画画素(抽出色画素)については、その画素値を算出した平均値で置換して出力する。この結果、着目ブロックには、文字線画が存在せず、実質的に高周波成分が除去された16×16画素の階調画像データが生成される。縮小部205は、入力した16×16画素の階調画像データ中の2×2画素を単位に、その平均値を算出し、算出した平均値を画素値とする画素データを出力することで、8×8画素の縮小階調画像データを出力する。なお、縮小部205は、2×2画素の平均値を算出するものとしたが、16×16画素の画像データを8×8画素の画像データに縮小できれば良いので、そのアルゴリズムは上記に限定されない。例えば、入力した16×16画素の階調画像データ中の2×2画素の1つをサンプリングして、それを8×8画素の縮小階調画像データとして出力しても構わない。階調データ符号化部206は、入力した8×8画素の縮小階調画像データを非可逆符号化(JPEGが好適である)し、その結果をパック部207に出力する。パック部207は、抽出部201から文字線画の色データを受信した場合(もしくは、文字線画が存在することを示す独立した制御信号を受信した場合としても良い)、入力した各データを結合し、図4(c)のようなデータ構造の符号化データを生成し、出力する。一方、パック部207は、抽出部201から文字線画の色データを受信しない場合(もしくは、文字線画が存在しないことを示す独立した制御信号を受信した場合)、入力した各データを結合し、図4(a)のようなデータ構造の符号化データを生成し、出力する(識別情報、色データは無視する)。
次に、本第2の実施形態における画像復号装置について説明する。図3に第2の実施形態における画像復号装置の構成例を示す。第1の実施形態と異なるのは、アンパック部301の動作と、第2の拡大部302と選択部303が追加されたことである。その他の構成要素とその動作は全て第1の実施形態と同じである。従って、ここではアンパック部301の動作の説明と、新たに追加された第2の拡大部302と選択部303の説明のみを行う。
アンパック部301は、入力された1ブロック分の符号化データから、モードデータ、色数データ、識別情報、階調画像に分離する。色数データの値は選択部303へ出力される。
第2の拡大部302は入力された復号後の多値画像データを拡大する。この第2の拡大部302は2色以上Th色未満の条件に該当しない画像に対する拡大処理を行うモジュールであり、線形補間のような公知の手法を用いれば良い。選択部303では、アンパック部より入力される色数データの値に従って、値が“1”であれば拡大部104からの出力を、“0”(色数が閾値Th以上の場合)であれば第2の拡大部303からの出力を選択して出力する。
上述したように色数に応じて拡大方法を選択することで、画像の階調性に応じてより適切な解像度変換を行うことが可能となる。
上記第1,第2の実施形態では、1ブロックのサイズを16×16画素とし、階調画像データが8×8画素の画像として縮小され符号化されているものとして説明したが、上記は例であって、かかるサイズによって本願発明が限定されるものではない。すなわち、1ブロックのサイズや階調画像の符号化データの画素数(実施形態では8×8画素)を示す情報をファイルヘッダに格納しておき、これを用いて復号しても良い。仮に、1ブロックが、その水平方法M画素、垂直方向N画素で表わされるM×N画素で表わされ、縮小階調画像のサイズがm×n画素(m<M,n<N)であった場合、拡大部104は復号して得られたm×n画素の1画素から、(M/m)×(N/n)個の画素を生成することを繰り返せば、元のM×N画素のブロックの階調画像を生成できる。
なお、上記第1、第2の実施形態では、1ブロックの符号化データのデータ構造は図4(a)乃至(c)のいずれかであるものとして説明した。図4(a)乃至(c)のいずれの場合であっても、1ブロック分の符号化データの最後は階調画像の非可逆符号化データは配置される。従って、仮に階調データの符号化データがその途中で打ち切りを行ったとしても、或る程度の階調画像が再現できることは約束される。すなわち、復号に必要な部分は、図4(b)や図4(c)における1ブロックの符号化データの先頭から、最悪の符号長となった識別情報の符号化データ+所定のビット数の固定長とすることができる。
また、実施形態ではデジタルカメラに適用する例を説明したが、画像符号化、復号に係る処理は、デジタルカメラだけでなく、プリンタ等の多くの技術分野に用いられるものであるので、上記実施形態によって本発明が限定されるものではない。
(その他の実施例)
また、本発明は、以下の処理を実行することによっても実現される。即ち、上述した実施形態の機能を実現するソフトウェア(プログラム)を、ネットワーク又は各種記憶媒体を介してシステム或いは装置に供給し、そのシステム或いは装置のコンピュータ(またはCPUやMPU等)がプログラムを読み出して実行する処理である。

Claims (7)

  1. M×N画素で構成されるブロックを単位とする符号化データから、階調画像データを復号する画像復号装置であって、
    符号化データを前記ブロックを単位に入力する入力手段と、
    入力した1ブロック分の符号化データから、当該符号化データを構成する、(1)当該ブロックに含まれる文字線画の画素値、(2)前記ブロック内の各画素が文字線画、非文字線画のいずれに属するかを示す識別情報の符号化データ、並びに、(3)前記ブロックのサイズよりも小さい、m×n画素(m<M、n<N)で表わされる階調画像データの符号化データを分離する分離手段と、
    前記識別情報の符号化データを復号する識別情報復号手段と、
    前記階調画像データの符号化データを復号する階調データ復号手段と、
    該階調データ復号手段で得られた、前記m×n画素で表わされる階調画像データ中の1画素から(M/m)×(N/n)個の画素を生成することを繰り返すことで、前記m×n画素で表わされる階調画像データから、前記M×N画素で表わされる前記ブロックのサイズの階調画像データを生成する拡大手段と、
    前記識別情報復号手段で得られた識別情報に従って、前記拡大手段で得られた前記ブロックの中の着目画素が文字線画、非文字線画のいずれに属するか否かを判定し、前記着目画素が非文字線画に属すると判定された場合には、前記拡大手段で得られた階調画像データ中の前記着目画素の位置の画素値を出力し、前記着目画素が前記文字線画に属すると判定した場合には前記分離手段で分離した文字線画の画素値を出力する画像合成手段とを備え、
    前記拡大手段は、
    前記階調データ復号手段で得られた、前記m×n画素の階調画像データから、当該階調画像データの画素値の取り得る範囲内にあって、代表となる2つの画素値C0、C1(C0≦C1)を算出する算出手段と、
    前記m×n画素の階調画像データ中の着目画素から生成しようとする(M/m)×(N/n)個の画素の中の、非文字線画に属する画素数Lを、前記識別情報を用いて判定する判定手段と、
    前記m×n画素の階調画像データ中の前記着目画素の画素値に従って、前記非文字線画に属するL個の画素のうち、L1(0≦L1≦L)で示される個数の画素が画素値C1を持ち、L0(=L−L1)で示される個数の画素が画素値C0を持つように設定する設定手段とを備え、
    該設定手段は、前記画素値C0、C1を両端とする数直線上の、前記着目画素の画素値で内分する位置に基づいて、前記L0、L1を決定することを特徴とする画像復号装置。
  2. M×N画素で構成されるブロックを単位とする符号化データから、階調画像データを復号する画像復号装置であって、
    符号化データを前記ブロックを単位に入力する入力手段と、
    入力した1ブロック分の符号化データから、当該符号化データを構成する、(1)当該ブロックに含まれる文字線画の画素値、(2)前記ブロック内の各画素が文字線画、非文字線画のいずれに属するかを示す識別情報の符号化データ、並びに、(3)前記ブロックのサイズよりも小さい、m×n画素(m<M、n<N)で表わされる階調画像データの符号化データを分離する分離手段と、
    前記識別情報の符号化データを復号する識別情報復号手段と、
    前記階調画像データの符号化データを復号する階調データ復号手段と、
    該階調データ復号手段で得られた、前記m×n画素で表わされる階調画像データ中の1画素から(M/m)×(N/n)個の画素を生成することを繰り返すことで、前記m×n画素で表わされる階調画像データから、前記M×N画素で表わされる前記ブロックのサイズの階調画像データを生成する拡大手段と、
    前記識別情報復号手段で得られた識別情報に従って、前記拡大手段で得られた前記ブロックの中の着目画素が文字線画、非文字線画のいずれに属するか否かを判定し、前記着目画素が非文字線画に属すると判定された場合には、前記拡大手段で得られた階調画像データ中の前記着目画素の位置の画素値を出力し、前記着目画素が前記文字線画に属すると判定した場合には前記分離手段で分離した文字線画の画素値を出力する画像合成手段とを備え、
    前記拡大手段は、
    前記階調データ復号手段で得られた、前記m×n画素の階調画像データから、当該階調画像データの画素値の取り得る範囲内にあって、代表となる2つの画素値C0、C1(C0≦C1)を算出する算出手段と、
    前記m×n画素の階調画像データ中の着目画素から生成しようとする(M/m)×(N/n)個の画素の中の、非文字線画に属する画素数Lを、前記識別情報を用いて判定する判定手段と、
    前記m×n画素の階調画像データ中の前記着目画素の画素値に従って、前記非文字線画に属するL個の画素のうち、L1(0≦L1≦L)で示される個数の画素が画素値C1を持ち、L0(=L−L1)で示される個数の画素が画素値C0を持つように設定する設定手段とを備え、
    設定手段は、前記m×n画素の階調画像データ中の前記着目画素に隣接する画素の合計値を算出し、前記m×n画素における前記非文字線画となるL個の画素のうち、前記合計値が大きい順にL1個の画素の画素値をC1とし、残りのL0個の画素の画素値をC0とすることを特徴とする像復号装置。
  3. M×N画素で構成されるブロックを単位とする符号化データから、階調画像データを復号する画像復号装置であって、
    符号化データを前記ブロックを単位に入力する入力手段と、
    入力した1ブロック分の符号化データから、当該符号化データを構成する、(1)当該ブロックに含まれる文字線画の画素値、(2)前記ブロック内の各画素が文字線画、非文字線画のいずれに属するかを示す識別情報の符号化データ、並びに、(3)前記ブロックのサイズよりも小さい、m×n画素(m<M、n<N)で表わされる階調画像データの符号化データを分離する分離手段と、
    前記識別情報の符号化データを復号する識別情報復号手段と、
    前記階調画像データの符号化データを復号する階調データ復号手段と、
    該階調データ復号手段で得られた、前記m×n画素で表わされる階調画像データ中の1画素から(M/m)×(N/n)個の画素を生成することを繰り返すことで、前記m×n画素で表わされる階調画像データから、前記M×N画素で表わされる前記ブロックのサイズの階調画像データを生成する拡大手段と、
    前記識別情報復号手段で得られた識別情報に従って、前記拡大手段で得られた前記ブロックの中の着目画素が文字線画、非文字線画のいずれに属するか否かを判定し、前記着目画素が非文字線画に属すると判定された場合には、前記拡大手段で得られた階調画像データ中の前記着目画素の位置の画素値を出力し、前記着目画素が前記文字線画に属すると判定した場合には前記分離手段で分離した文字線画の画素値を出力する画像合成手段とを備え、
    前記拡大手段は、
    前記階調データ復号手段で得られた、前記m×n画素の階調画像データから、当該階調画像データの画素値の取り得る範囲内にあって、代表となる2つの画素値C0、C1(C0≦C1)を算出する算出手段と、
    前記m×n画素の階調画像データ中の着目画素から生成しようとする(M/m)×(N/n)個の画素の中の、非文字線画に属する画素数Lを、前記識別情報を用いて判定する判定手段と、
    前記m×n画素の階調画像データ中の前記着目画素の画素値に従って、前記非文字線画に属するL個の画素のうち、L1(0≦L1≦L)で示される個数の画素が画素値C1を持ち、L0(=L−L1)で示される個数の画素が画素値C0を持つように設定する設定手段とを備え、
    該設定手段は、前記m×n画素の階調画像データ中の前記着目画素の画素値の大きさに基づいて、前記L1の値を設定し、
    前記分離手段は、1ブロックの符号化データから、更に、前記ブロックに含まれる色数が予め設定された閾値Th未満か否かを示す色数データを分離し、
    前記色数データが、前記ブロックに含まれる色数が前記閾値Th以上あることを示している場合に限り、前記拡大手段は、前記階調データ復号手段で得られた前記m×n画素の階調画像データを線形補間して前記M×N画素で表わされる前記ブロックのサイズの階調画像データを生成することを特徴とする像復号装置。
  4. 前記算出手段は、
    前記階調データ復号手段で得られた、前記m×n画素の階調画像データの各画素の値の最小値をC0、最大値をC1として算出することを特徴とする請求項1乃至3のいずれか1項に記載の画像復号装置。
  5. M×N画素で構成されるブロックを単位とする符号化データから、階調画像データを復号する画像復号装置の制御方法であって、
    入力手段が、符号化データを前記ブロックを単位に入力する入力工程と、
    分離手段が、入力した1ブロック分の符号化データから、当該符号化データを構成する、(1)当該ブロックに含まれる文字線画の画素値、(2)前記ブロック内の各画素が文字線画、非文字線画のいずれに属するかを示す識別情報の符号化データ、並びに、(3)前記ブロックのサイズよりも小さい、m×n画素(m<M、n<N)で表わされる階調画像データの符号化データを分離する分離工程と、
    識別情報復号手段が、前記識別情報の符号化データを復号する識別情報復号工程と、
    階調データ復号手段が、前記階調画像データの符号化データを復号する階調データ復号工程と、
    拡大手段が、該階調データ復号工程で得られた、前記m×n画素で表わされる階調画像データ中の1画素から(M/m)×(N/n)個の画素を生成することを繰り返すことで、前記m×n画素で表わされる階調画像データから、前記M×N画素で表わされる前記ブロックのサイズの階調画像データを生成する拡大工程と、
    画像合成手段が、前記識別情報復号工程で得られた識別情報に従って、前記拡大工程で得られた前記ブロックの中の着目画素が文字線画、非文字線画のいずれに属するか否かを判定し、前記着目画素が非文字線画に属すると判定された場合には、前記拡大工程で得られた階調画像データ中の前記着目画素の位置の画素値を出力し、前記着目画素が前記文字線画に属すると判定した場合には前記分離工程で分離した文字線画の画素値を出力する画像合成工程とを備え、
    前記拡大工程は、
    前記階調データ復号工程で得られた、前記m×n画素の階調画像データから、当該階調画像データの画素値の取り得る範囲内にあって、代表となる2つの画素値C0、C1(C0≦C1)を算出する算出工程と、
    前記m×n画素の階調画像データ中の着目画素から生成しようとする(M/m)×(N/n)個の画素の中の、非文字線画に属する画素数Lを、前記識別情報を用いて判定する判定工程と、
    前記m×n画素の階調画像データ中の前記着目画素の画素値に従って、前記非文字線画に属するL個の画素のうち、L1(0≦L1≦L)で示される個数の画素が画素値C1を持ち、L0(=L−L1)で示される個数の画素が画素値C0を持つように設定する設定工程とを含み、
    該設定工程は、前記画素値C0、C1を両端とする数直線上の、前記着目画素の画素値で内分する位置に基づいて、前記L0、L1を決定することを特徴とする画像復号装置の制御方法。
  6. コンピュータに読み込ませ実行させることで、前記コンピュータを、M×N画素で構成されるブロックを単位とする符号化データから、階調画像データを復号する画像復号装置として機能させるプログラムであって、
    前記コンピュータを、
    符号化データを前記ブロックを単位に入力する入力手段と、
    入力した1ブロック分の符号化データから、当該符号化データを構成する、(1)当該ブロックに含まれる文字線画の画素値、(2)前記ブロック内の各画素が文字線画、非文字線画のいずれに属するかを示す識別情報の符号化データ、並びに、(3)前記ブロックのサイズよりも小さい、m×n画素(m<M、n<N)で表わされる階調画像データの符号化データを分離する分離手段と、
    前記識別情報の符号化データを復号する識別情報復号手段と、
    前記階調画像データの符号化データを復号する階調データ復号手段と、
    該階調データ復号手段で得られた、前記m×n画素で表わされる階調画像データ中の1画素から(M/m)×(N/n)個の画素を生成することを繰り返すことで、前記m×n画素で表わされる階調画像データから、前記M×N画素で表わされる前記ブロックのサイズの階調画像データを生成する拡大手段と、
    前記識別情報復号手段で得られた識別情報に従って、前記拡大手段で得られた前記ブロックの中の着目画素が文字線画、非文字線画のいずれに属するか否かを判定し、前記着目画素が非文字線画に属すると判定された場合には、前記拡大手段で得られた階調画像データ中の前記着目画素の位置の画素値を出力し、前記着目画素が前記文字線画に属すると判定した場合には前記分離手段で分離した文字線画の画素値を出力する画像合成手段として機能させ、
    前記拡大手段は、
    前記階調データ復号手段で得られた、前記m×n画素の階調画像データから、当該階調画像データの画素値の取り得る範囲内にあって、代表となる2つの画素値C0、C1(C0≦C1)を算出する算出手段と、
    前記m×n画素の階調画像データ中の着目画素から生成しようとする(M/m)×(N/n)個の画素の中の、非文字線画に属する画素数Lを、前記識別情報を用いて判定する判定手段と、
    前記m×n画素の階調画像データ中の前記着目画素の画素値に従って、前記非文字線画に属するL個の画素のうち、L1(0≦L1≦L)で示される個数の画素が画素値C1を持ち、L0(=L−L1)で示される個数の画素が画素値C0を持つように設定する設定手段とを備え、
    該設定手段は、前記画素値C0、C1を両端とする数直線上の、前記着目画素の画素値で内分する位置に基づいて、前記L0、L1を決定することを特徴とするプログラム。
  7. 請求項に記載のプログラムを格納したことを特徴とするコンピュータが読み込み可能な記憶媒体。
JP2010113421A 2010-05-17 2010-05-17 画像復号装置及びその制御方法、並びにプログラム及びコンピュータ可読記憶媒体 Expired - Fee Related JP5597028B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2010113421A JP5597028B2 (ja) 2010-05-17 2010-05-17 画像復号装置及びその制御方法、並びにプログラム及びコンピュータ可読記憶媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2010113421A JP5597028B2 (ja) 2010-05-17 2010-05-17 画像復号装置及びその制御方法、並びにプログラム及びコンピュータ可読記憶媒体

Publications (3)

Publication Number Publication Date
JP2011244152A JP2011244152A (ja) 2011-12-01
JP2011244152A5 JP2011244152A5 (ja) 2013-06-20
JP5597028B2 true JP5597028B2 (ja) 2014-10-01

Family

ID=45410365

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010113421A Expired - Fee Related JP5597028B2 (ja) 2010-05-17 2010-05-17 画像復号装置及びその制御方法、並びにプログラム及びコンピュータ可読記憶媒体

Country Status (1)

Country Link
JP (1) JP5597028B2 (ja)

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3026706B2 (ja) * 1993-09-27 2000-03-27 キヤノン株式会社 画像処理装置
JP4871822B2 (ja) * 2007-09-20 2012-02-08 キヤノン株式会社 画像符号化装置及びその制御方法

Also Published As

Publication number Publication date
JP2011244152A (ja) 2011-12-01

Similar Documents

Publication Publication Date Title
JP4902569B2 (ja) 画像符号化装置及びその制御方法
JP4979323B2 (ja) 画像処理装置及びその制御方法
US8553301B2 (en) Image processing apparatus, method, and program product to perform color-reduction processing for a block
US8213727B2 (en) Image encoding apparatus and image decoding apparatus, and control method thereof
JP4176114B2 (ja) 画像圧縮装置およびそれを備えた画像読取装置、画像圧縮装置を備えた画像処理装置並びにそれを備えた画像形成装置、画像圧縮処理方法
JP4956304B2 (ja) 画像符号化装置及びその制御方法、並びに、コンピュータプログラム及びコンピュータ可読記憶媒体
US8244033B2 (en) Image encoding apparatus, image decoding apparatus, and control method thereof
JP2001094990A (ja) 画像符号化装置
JP4958832B2 (ja) 画像符号化装置及びその制御方法
JPH1188700A (ja) カラー画像信号の符号化方法、復号化方法およびカラー画像処理装置
US20050036694A1 (en) Compression of mixed raster content (MRC) image data
US8023756B2 (en) Image encoding apparatus and method of controlling same
JP2008042683A (ja) 画像処理装置及びその制御方法、並びに、コンピュータプログラム及びコンピュータ可読記憶媒体
JP5597028B2 (ja) 画像復号装置及びその制御方法、並びにプログラム及びコンピュータ可読記憶媒体
JP2009159598A (ja) 画像処理装置、画像処理方法および画像処理プログラム
JP4462055B2 (ja) 画像処理装置および画像処理方法
JP4802853B2 (ja) 画像処理装置および画像処理プログラム
JP5432690B2 (ja) 画像符号化装置及びその制御方法
JP2013038656A (ja) 画像符号化装置及びその制御方法
JP4757172B2 (ja) 画像符号化装置及びその制御方法
JP4971880B2 (ja) 画像符号化装置及び画像復号装置、並びにそれらの制御方法
JP5538985B2 (ja) 画像符号化装置及びその制御方法
JP3354076B2 (ja) 画像圧縮方法、画像伸張方法、画像圧縮装置及び画像伸張装置
JP4860558B2 (ja) 符号化装置及び符号化方法
JP2004222142A (ja) 映像信号の圧縮方法および復号方法

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130507

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20130507

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20140428

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20140516

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140627

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20140714

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140808

R151 Written notification of patent or utility model registration

Ref document number: 5597028

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

LAPS Cancellation because of no payment of annual fees