JP3771175B2 - 画像符号化装置、画像符号化方法、画像符号化プログラム、画像符号化プログラムを記録した記録媒体 - Google Patents

画像符号化装置、画像符号化方法、画像符号化プログラム、画像符号化プログラムを記録した記録媒体 Download PDF

Info

Publication number
JP3771175B2
JP3771175B2 JP2002024121A JP2002024121A JP3771175B2 JP 3771175 B2 JP3771175 B2 JP 3771175B2 JP 2002024121 A JP2002024121 A JP 2002024121A JP 2002024121 A JP2002024121 A JP 2002024121A JP 3771175 B2 JP3771175 B2 JP 3771175B2
Authority
JP
Japan
Prior art keywords
code amount
image
code
compression rate
amount
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2002024121A
Other languages
English (en)
Other versions
JP2003230162A (ja
JP2003230162A5 (ja
Inventor
麻衣子 山田
宏幸 作山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP2002024121A priority Critical patent/JP3771175B2/ja
Publication of JP2003230162A publication Critical patent/JP2003230162A/ja
Publication of JP2003230162A5 publication Critical patent/JP2003230162A5/ja
Application granted granted Critical
Publication of JP3771175B2 publication Critical patent/JP3771175B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Color Television Systems (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression Of Band Width Or Redundancy In Fax (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、画像符号化装置に関し、特に視覚的重みに基づいて符号化を行うことで画質を保持する画像符号化装置、画像符号化方法、画像符号化プログラム、画像符号化プログラムを記録した記録媒体に関する。
【0002】
【従来の技術】
従来、画像符号化を行う際は、一般的に(色変換)→(周波数領域の係数への変換)→(係数の量子化)→(エントロピー符号化)という手順が取られている。またこの際、低域の画像データを多く残し、高域の画像データを多く削ることで、同等量の圧縮をした場合でも比較的良い画質が得られることが知られている。これは、人間の視覚特性によるものである。
【0003】
上記手順において量子化を行う際には、処理を簡易にするために画像特性(細やかな絵柄が多い画像か、平坦な絵柄の画像か等)を考慮しないで、所定の定数で係数の除算を行うという、一律な量子化が行われていた。
【0004】
しかし、画像特性を考慮しない一律な量子化では、圧縮率が高い(=除算時の定数が大きい)場合に、低域に較べて高域の画像データ、即ち符号量を多く削りすぎてしまい、画質が保持できなくなるという問題が生じる。また、圧縮率が低い場合には、高域に較べて低域の符号量を多く削りすぎてしまうという問題も存在する。
【0005】
このような問題を解決する技術として、符号化時、人間の視覚特性を考慮することによって、削減すべき符号量を精度良く求め、合理的な符号量配分を行う技術が特開平5−83560号公報に開示されている。
【0006】
【発明が解決しようとする課題】
しかしながら、特開平5−83560号公報が開示する技術では、削減すべき符号量の算出方法が原画像に基づくものではなく、予め用意された標準的な画像に基づくものであるため、原画像の符号量特性と誤差とが生じる可能性が大きいという問題がある。
【0007】
本発明は、上記問題に鑑みてなされたものであり、原画像の符号量特性に基づいて精度良く符号量を削減する画像符号化装置、画像符号化方法、画像符号化プログラム、画像符号化プログラムを記録した記録媒体を提供することを目的とする。
【0008】
【課題を解決するための手段】
係る目的を達成するために、請求項1記載の発明は、周波数領域に変換された画像データを符号化する画像符号化装置であって、ロスレスのエントロピー符号化により得られた前記画像データの周波数領域毎の符号量の分布に基づき、符号量を削減する符号量削減手段を有し、前記エントロピー符号化により得られた周波数領域毎の符号量に、視覚伝達関数の逆数を乗じることで得られる値に基づき、符号量を削減することを特徴としている。
【0009】
これにより、請求項1記載の発明では、視覚特性を反映させながら、原画像の符号量特性に基づいて精度良く符号量を削減する画像符号化装置を提供することが可能となる。
【0010】
また、請求項2記載の発明は、周波数領域に変換された複数のコンポーネントからなる画像データを符号化する画像符号化装置であって、ロスレスのエントロピー符号化により得られた前記画像データの周波数領域毎の符号量の分布に基づき、符号量を削減する符号量削減手段を有し、前記エントロピー符号化により得られた周波数領域毎の符号量に対して、前記コンポーネント毎に視覚伝達関数の逆数を乗じることで得られる値に基づき、符号量を削減することを特徴としている。
【0011】
これにより、請求項2記載の発明では、圧縮率を保ちつつ、コンポーネント毎に視覚特性を反映することで、より原画像の符号量特性に基づいて精度良く符号量を削減する画像符号化装置を提供することが可能となる。
【0012】
更に、請求項3記載の発明は、前記符号量削減手段は、低圧縮率である場合と高圧縮率である場合とで符号量の削減を変えることを特徴としている。
【0013】
これにより、請求項3記載の発明では、原画像の符号量特性に基づいて精度良く符号量を削減する画像符号化装置において、圧縮率によって符号量削減方法を変えることで、より画質劣化を低減させることが可能となる。
【0014】
更に、請求項4記載の発明は、前記符号量削減手段は、ある一定の圧縮率までは全域に渡って平均的に符号量を削減し、前記圧縮率以上からは高域から順に符号量を削減することを特徴としている。
【0015】
これにより、請求項4記載の発明では、原画像の符号量特性に基づいて精度良く符号量を削減する画像符号化装置において、急激な画質劣化を低減することが可能となる。
【0016】
更に、請求項5記載の発明は、前記符号量削減手段は、所定の圧縮率以下である場合、全域に渡って、前記符号量又は前記視覚特性に基づいた符号量の比と略同じ比率で符号量を削減することを特徴としている。
【0017】
これにより、請求項5記載の発明では、原画像の符号量特性に基づいて精度良く符号量を削減する画像符号化装置において、よりバランスの取れた画質を得ることが可能となる。
【0018】
更に、請求項6記載の発明は、前記符号量削減手段は、所定の圧縮率以上である場合、当該圧縮率までは、全域に渡って、前記符号量又は前記視覚特性に基づいた符号量の比と略同じ比率で符号量を削減することを特徴としている。
【0019】
これにより、請求項6記載の発明では、原画像の符号量特性に基づいて精度良く符号量を削減する画像符号化装置において、急激な画質劣化を低減させることが可能となる。
【0020】
更に、請求項7記載の発明は、周波数領域に変換された画像データを符号化する画像符号化方法であって、ロスレスのエントロピー符号化により得られた前記画像データの周波数領域毎の符号量の分布に基づき、符号量を削減する符号量削減工程を有し、前記エントロピー符号化により得られた周波数領域毎の符号量に、視覚伝達関数の逆数を乗じることで得られる値に基づき、符号量を削減することを特徴としている。
【0021】
これにより、請求項7記載の発明では、視覚特性を反映させながら、原画像の符号量特性に基づいて精度良く符号量を削減する画像符号化方法を提供することが可能となる。
【0022】
更に、請求項8記載の発明は、周波数領域に変換された複数のコンポーネントからなる画像データを符号化する画像符号化方法であって、ロスレスのエントロピー符号化により得られた前記画像データの周波数領域毎の符号量の分布に基づき、符号量を削減する符号量削減工程を有し、前記エントロピー符号化により得られた周波数領域毎の符号量に対して、前記コンポーネント毎に視覚伝達関数の逆数を乗じることで得られる値に基づき、符号量を削減することを特徴としている。
【0023】
これにより、請求項8記載の発明では、圧縮率を保ちつつ、コンポーネント毎に視覚特性を反映することで、より原画像の符号量特性に基づいて精度良く符号量を削減する画像符号化方法を提供することが可能となる。
【0024】
更に、請求項9記載の発明は、前記符号量削減工程は、低圧縮率である場合と高圧縮率である場合とで符号量の削減を変えることを特徴としている。
【0025】
これにより、請求項9記載の発明では、原画像の符号量特性に基づいて精度良く符号量を削減する画像符号化方法において、圧縮率によって符号量削減方法を変えることで、より画質劣化を低減させることが可能となる。
更に、請求項10の発明では、前記符号量削減工程は、ある一定の圧縮率までは全域に渡って平均的に符号量を削減し、前記圧縮率以上からは高域から順に符号量を削減することを特徴としている。
これにより、請求項10記載の発明では、原画像の符号量特性に基づいて精度良く符号量を削減する画像符号化方法において、急激な画質劣化を低減することが可能となる。
更に、請求項11の発明では、前記符号量削減工程は、所定の圧縮率以下である場合、全域に渡って、前記符号量又は前記視覚特性に基づいた符号量の比と略同じ比率で符号量を削減することを特徴としている。
これにより、請求項11記載の発明では、原画像の符号量特性に基づいて精度良く符号量を削減する画像符号化方法において、よりバランスの取れた画質を得ることが可能となる。
更に、請求項12の発明では、前記符号量削減工程は、所定の圧縮率以上である場合、当該圧縮率までは、全域に渡って、前記符号量又は前記視覚特性に基づいた符号量の比と略同じ比率で符号量を削減することを特徴としている。
これにより、請求項12記載の発明では、原画像の符号量特性に基づいて精度良く符号量を削減する画像符号化方法において、急激な画質劣化を低減させることが可能となる。
【0026】
【発明の実施の形態】
〔原理〕
本発明を好適に実施した形態を説明するにあたり、その原理について先に述べる。
【0027】
上記従来技術の説明で述べたような、「画像データ」と「符号量」とを同等な扱いとしたのには以下に示すような理由がある。
【0028】
一般的に平均情報量はエントロピーと呼ばれるが、上記で述べた(色変換)→(周波数領域の係数への変換)→(係数の量子化)→(エントロピー符号化)の手順における「エントロピー符号化」とは、「画像データのエントロピー(平均情報量)を反映した形で符号化する」ことを意味する。即ち、通常、エントロピー符号化後の符号量は、その画像のデータ量をある程度反映したものとなる。従って、「画像データ量≒符号量」というモデル化が可能である。
【0029】
そこで「原画像の特性≒画像のデータ量≒符号量」と考えれば、ロスレスのサブバンド全体でエントロピー符号化を行って符号量(の分布)を得た後、それを考慮して再度の量子化或いは符号の破棄等を行うことにより、原画像の特性に合わせた符号が得られる。本発明では、このようにエントロピー符号化により得られた符号量を考慮することによって、エントロピー符号化で得られる符号量の多い画像と少ない画像とに対する量子化方法(符号量の破棄方法)を変える。
【0030】
また、通常、画像を周波数変換してから符号化する方式では、サブバンド符号化に代表されるように周波数領域毎に符号化を施す。このため、符号量としては周波数領域毎に参照することが可能である。従って、周波数領域毎の符号量分布を考慮して、より精密な量子化方法(破棄方法)の調整をするよう構成することも可能である。尚、例えばJPEG2000のような、サブバンド毎の符号量をヘッダ情報として含む符号化方式では、一度得た符号から部分的に符号を破棄することで、最終的な符号量を制御することは容易である。
【0031】
このように本発明は、周波数領域に変換された画像データを符号化する際に、ロスレスのサブバンド全体のエントロピー符号化後の符号量に基づいて符号量を削減することを特徴としている。これにより本発明では、原画像の特性を考慮した符号化を行うことが可能となる。
【0032】
また、上記で延べた「符号量」はロスレスのものに限定される必要はない。例えば、均一に量子化された後の符号量は、原画像のデータ量がかなりの程度反映されている。更に、この符号量を生成するにあたり用いた量子化方法が明らかであれば(通常、符号のためには量子化方法は明らかである必要がある)、原画像のデータ量を推測することも可能である。従って、ロスが存在する場合でも、本発明を適用することは可能である。
【0033】
但し、原画像にはノイズ成分が含まれている場合がある。このため、ロスレスの場合にはノイズ自体も情報量として符号化される。しかしながら、ノイズが含まれる画像は、量子化することでその多くを削減することが可能である。このため、量子化を取り入れることにより、ノイズ成分を除いた原画像の情報量を基に量子化方法(符号破棄方法)を制御することが可能となる。
【0034】
このように本発明は、周波数領域に変換された画像データを符号化する際に、量子化後のエントロピー符号化により得られた符号量に基づいて削減する符号量を決定することを特徴としている。これにより本発明では、ノイズ成分の影響を低減し、原画像の特性を考慮した符号化を行うことが可能となる。
【0035】
また、上記では「原画像のデータ量≒符号量」というモデルを採用したが、人間の視覚では、単純に「画像のデータ量=画質」、即ちデータ量が多い画像程、良い画質と認識されるとは限らない。これは、人間の視覚がローパスフィルタだからであり、高周波成分が強く認識されないためである。このため、同じ符号量でも高周波成分の符号量は、より破棄の対象として良いと言える。
【0036】
そこで本発明は、上記した特徴の他に、視覚特性に基づきながら符号量を削減することも特徴としている。これにより本発明では、視覚的な重みに基づいて、より良い画質を保つことが可能となる。
【0037】
ここで、視覚的な重みを表す関数の代表例として、視覚伝達関数(visual transfer function:VTF)が存在する。VTFとは、視覚系の振幅伝搬特性(Modulation Transfer Function:MTF)のことであり、以下の(式1)で表されるものである。
VTF=5.05(e−0.843f)(1−e0.611f):(但し、f>0.79)
=1.0 …(式1)
但し、上記(式1)において、fは空間周波数であり、単位は[cycle/mm]である。
【0038】
このVTFは、簡単には周波数毎の視覚の感度を示している(詳細は画像写真学会年次大会『Japan Hardcopy ’95』論文集155−158(:以下、引用文献1という)を参照されたい)。
【0039】
一般的に、ウェーブレット符号化に代表されるサブバンド符号化は、画像を周波数領域毎のサブバンドに変換するが、これに対してVTFは周波数の関数であるため、サブバンド毎の符号量にVTFの逆数をかければ、いわば「視覚的に鈍感な程度(=VTFの逆数)を反映した符号量」即ち「視覚的に削減可能な程度が反映された削減前の符号量」を得ることができる。ここで、サブバンドとは、例えば3回のサブバンド分割を行った場合、図2に示されているような、それぞれの分割によって得られた3LL,3LH,3HL,3HH,2LH,2HL,2HH,1LH,1HL,1HHのことである。
【0040】
このように本発明は、上記した特徴の他に、ロスレスの符号量に視覚伝達関数(VTF)の逆数を乗じたものに基づきながら、符号量を削減していくことを特徴としている。これにより本発明では、視覚特性を反映しながら原画像の特性を考慮した符号化を行うことが可能となる。
【0041】
更に本発明は、上記した特徴の他に、量子化後の符号量に視覚伝達関数VTFの逆数を乗じたものに基づきながら、符号量を削減していくことを特徴としている。これにより本発明では、ノイズ成分の影響を低減し、且つ視覚特性を反映しながら、原画像の特性を考慮した符号化を行うことが可能となる。
【0042】
また、画像が複数のコンポーネント(R,G,Bの3つのコンポーネントや、輝度Y,色差Cb,色差Crの3つのコンポーネント等)から成る場合、上記した視覚特性はコンポーネント毎に異なるものとなる。例えばWatson, G.Yang, J.Villasenorによる“Visibility of wavelet quantization noise”, IEEE Trans.on Image Proc., vol.6, pp.1164−1175, 1997(以下、引用文献2という)に記載されているように、知覚可能な量子誤差の最大値が、輝度Y,色差Cb,色差Crでおよそ1:2:4の比となる実験結果が存在する。この実験結果のグラフを図3に示す。
【0043】
図3は、横軸に空間周波数、縦軸に量子化誤差が取られている。また、図3中の「or=1,2,3,4」は順にLL,HL,HH,LHと対応する。更に、図3中、下方に位置する曲線から順に輝度Y成分,色差Cr成分,色差Cb成分の実験値を示している。この図3からも明らかなように、空間周波数の高い部分においては一部例外があるものの、輝度Y成分,色差Cr成分,色差Cb成分の順に量子化誤差が少ないことが解る。
【0044】
ここでいう量子化誤差とは、認識されない程度の誤差の限界値であり、これ以上量子化を行った場合には認識される程度の誤差が生じると判断する際の指標となるものである。即ち、量子化誤差が少ないということは、それだけ量子化がし難く、人間の目にとって敏感であるということになる。逆に量子化誤差が大きいということは、より量子化がし易く、人間の目にとって鈍感であるということになる。このように、人間の目の見え易さを表す輝度Y,色差Cr,色差Cb毎の視覚伝達関数VTFによる関係は、上述の引用文献2及び図3にも示されているように、4:2:1として扱うことができる。
【0045】
ここで、輝度Y,色差Cb,色差Crとは、RGBの3つのコンポーネント(R,G,B)を以下に示す(式2)で変換することにより得られるものであり、輝度や色差のコンポーネントのことである。但し、(式2)はJPEGにおける色変換で広く使用されている用いられる式である。
輝度Y =0.29R+0.587G+0.114B
色差Cb=0.5R−0.4187G−0.01813B
色差Cr=−0.1687R−0.3313G+0.5B …(式2)
そこで、本発明は、上記した特徴の他に、画像が複数のコンポーネントで構成されている場合、該コンポーネント毎に上記視覚特性又は視覚伝達関数(VTF)を反映して、削減する符号量を決定することを特徴とする。これにより本発明では、圧縮率を保ちつつ、コンポーネント毎にVTFが反映され、より画質劣化を防止することが可能となる。
【0046】
また、本発明では、以上で得られた周波数領域毎の「視覚的に削減可能な程度が反映された削減前の符号量」に基づいて、原画像の特性をどう反映しながら符号量を削減するかが問題となる。これは符号量の削減をどの程度簡易に行うか、又、低域から高域のバランスをどうするか、等によって幾通りかの方法を取ることができる。
【0047】
上記「視覚的に削減可能な程度が反映された削減前の符号量」は、周波数領域毎のVTFを考慮したものであり、いわゆる正規化したものである。このため、正規化自体が適正に行われていれば、基本的にはどの周波数を削っても同じ程度の画質劣化が生じると期待される。しかしながら、低域の符号を中心に削った場合と、高域の符号を中心に削った場合とでは、認識される画像が違うタイプのものとなる。即ち、前者では全体にシャープではあるが低域のムラが目立つ画像と認識され、後者では低域のムラは生じにくいが全体にぼやけた画像と認識される。このように、高域の符号を削減した場合と、低域の画像を削減した場合とでは、観察者に与える印象が異なる。
【0048】
画像を圧縮する場合には観察者の嗜好にも依存するため、設計思想等によって上記のような符号の削減方法を選択しなければならない。ここで、原画像の特性を反映する方法としては、周波数領域毎に見た場合に「視覚的に削減可能な程度の符号量が多い」帯域から順に削減する方法や、低域から高域に渡って平均的に符号量を削減する方法等が存在する。前者は処理が簡易であり、低域重視の仕上がりとなる。一方、後者はバランスの取れた画像を得ることができる。
【0049】
しかしながら、後者の場合、高圧縮率に設定すると、削減する符号量が大幅に増加するため、過剰に低域の符号量が少なくなる傾向にあり、急激な画質劣化を生じる可能性がある。
【0050】
そこで、高圧縮率の場合でも急激な画質劣化をなるべく抑えるために、本発明では、ある一定の圧縮率までは全域に渡って平均的に符号量を削減し、ある一定の圧縮率以上からは高域から順に符号量を削減する方式を取る。この方式によれば、急激な画質劣化を低減することができる。
【0051】
このように本発明は、上記した特徴の他に、周波数領域に変換された画像データを符号化する際に、低圧縮率である場合と高圧縮率である場合とで、ロスレスの符号量に視覚伝搬関数(VTF)の逆数を乗じたものに基づいて、採用する削減方法を変えることを特徴としている。これにより本発明では、低圧縮でも高圧縮でも高画質を実現することが可能となる。
【0052】
また、本発明は、上記した特徴の他に、ある一定の圧縮率以下である場合、全域に渡って、符号量又は、視覚特性に基づいた符号量の比と略同じ比率で符号量を削減することを特徴としている。これにより本発明では、よりバランスの取れた画質を得ることが可能となる。
【0053】
また、本発明は、上記した特徴の他に、ある一定の圧縮率以上である場合、この圧縮率までは、全域に渡って、符号量又は、視覚特性に基づいた符号量の比と略同じ比率で符号量を削減し、ある一定の圧縮率以上である場合、高域から順に符号量を削減することを特徴としている。これにより本発明では、2つの削減方法が使い分けられ、急激な画質劣化を低減させることが可能となる。
【0054】
以下、本発明を好適に実施した形態について、その具体例を挙げて詳細に説明する。
〔第1の実施例〕
まず、本発明の第1の実施例について図面を用いて詳細に説明する。
【0055】
図1は、本実施例に係る画像符号化を実現する装置の構成例を示すブロック図である。図1を参照すると、本装置は、PC10とプリンタ20とを有して構成されており、これらが例えばシリアル回線やパラレル回線等で構成されたデータバス1を介して接続されている。
【0056】
PC10は、CPU(Central Processing Unit)11や,RAM(Random Access Memory)12や,HDD(Hard Disk Drive)13等を有して構成される。但し、この構成においてHDD13は、シリアル回線やパラレル回線等の所定の通信回線を介してPC10に対し外付けされたものであっても良い。また、プリンタ20は、CPU21や,RAM22等を有して構成され、データバス1を介して入力された画像データを伸張し、出力する。
【0057】
この構成において、例えばHDD13内に格納された原画像Aをプリントアウトする場合、原画像AはPC10において圧縮された後、プリンタ20へ送信され、プリンタ20において伸張される。この際、原画像Aを圧縮する理由は、PC10→プリンタ20間の送信データ量を低減させるためである。これにより、送信時間が短縮され、圧縮・伸張に要する時間を加味してもプリントアウトまでに要する時間が短縮される。
【0058】
また、HDD13内に格納された原画像Aをプリントアウトする際の一連の流れは以下の(1)〜(7)のようになる。
(1)CPU11からの命令により、HDD13上に記録された原画像AがRAM12上に読み込まれる。
(2)CPU11がRAM12上の原画像A’を読み込み、これを所定の圧縮方法で圧縮する。
(3)(2)で作成された圧縮画像BをRAM12上の別領域に書き込む。
(4)CPU11からの命令により、RAM12上の圧縮画像Bがデータバス1を介してプリンタ20へ送信され、プリンタ20におけるRAM22上に書き込まれる。
(5)CPU21がRAM22上の圧縮画像B’を読み込み、これを所定の伸張方法で伸張する。
(6)(5)で作成された伸張画像CをRAM22上の別領域に書き込む。
(7)CPU21からの命令により、伸張された伸張画像Cを所定の手順(変倍がかかる)で印刷エンジンへ出力し、プリントアウトする。
【0059】
次に、本実施例における処理の流れを説明する。
【0060】
本実施例では、まず原画像A(以下、説明の都合上、画像データという)を周波数領域に変換する。このように周波数領域に変換すると、これに対してロスレスのサブバンド全体のエントロピー符号化を施す。その後、符号化された画像データに対して、視覚的重みが考慮された符号量の削減を施す。
【0061】
この流れを図5に示すフローチャートを用いて説明する。但し、本実施例では、サブバンド符号化方式を採用した場合について説明する。
【0062】
従って、本実施例では、まず、ステップS101として、画像データを128画素×128画素のタイルに分割し、それぞれに対して3回のウェーブレット変換を行う。これにより図2に示すようなサブバンド構造を有するタイルが作成される。
【0063】
次に、ステップS102において、ステップS101で作成したタイルに対し、ロスレスのサブバンド全体のエントロピー符号化を行う。また、このエントロピー符号化により得られた符号量を保持する。保持する先としては、エントロピー符号化を行うエンコーダとする。但し、本実施例においてエンコーダはCPU11及びRAM12によりプログラムを用いて実現されるため、保持先はRAM12となる。更に、ステップS102では、保持した符号量に対して個々に視覚系のMTF(VTF)の逆数を乗じることで正規化し、これにより得られた値(視覚特性が反映された符号量:以下、正規化された符号量という)をRAM12に保持する。
【0064】
その後、ステップS103において、正規化された符号量を読み出し、それぞれのコンポーネント毎のサブバンドにおいて符号量の多いものから順に所定の条件を満たすまで符号量を削減する。この際の所定の条件については、以下において詳細に説明する。
【0065】
また、ステップS101からステップS103までの処理は、全てのタイルに対して完了するまで繰り返し行われる(ステップS104)。
【0066】
ここで、各サブバンドの周波数は、画像データの解像度と観察距離との関数になる。例えば上記で触れた引用文献2に記載されているように、LL,HL,LH,HHの4つのサブバンドは異なるフーリエスペクトルを生じる。このため、各サブバンドに生じた誤差に対する視覚の感度は、サブバンド毎に異なると考えられている。上述において触れた引用文献2によれば、LL,HL,LH,HHの視覚の感度比は、おおよそ1:(1/1.3):(1/1.3):(1/1.8)となっている。
【0067】
そこで、本実施例では、周波数の違いによるVTFの値の差に加え、サブバンド毎の感度の違いも考慮に入れる。
【0068】
例えば3LL,3HL,3LH,3HHの空間周波数を‘1’とした場合、2HL,2LH,2HHの空間周波数は‘2’となり、1HL,1LH,1HHの空間周波数は‘4’となる。
【0069】
また、例えば下記の(式3)(:(式1)に対応)を、LLのVTFとして用いたとすると、HL,LHのVTFとHHのVTFとの式は、各々下記の(式4),(式5)のようになる。
VTF_LL=5.05(e−0.843f)(1−e0.611f):(但し、f>0.79)
=1.0 …(式3)
VTF_(HL,LH)=5.05(e−0.843f)(1−e−0.611f)/1.3 …(式4)
VTF_HH =5.05(e−0.843f)(1−e−0.611f)/1.8 …(式5)
これにより、(式3),(式4),(式5)により導き出せる、空間周波数に対するVTFの関係は、図4に示すようになる。
【0070】
よって、上記での空間周波数に対する輝度Y成分のVTFの値は、以下のようになる。
3YLL=0.99
3YHL=0.76
3YLH=0.76
3YHH=0.55
2YHL=0.51
2YLH=0.51
2YHH=0.37
1YHL=0.12
1YLH=0.12
1YHH=0.09
また、輝度Y成分のVTFの値の逆数は、以下のようになる。
3YLL=1/0.99
3YHL=1/0.76
3YLH=1/0.76
3YHH=1/0.55
2YHL=1/0.51
2YLH=1/0.51
2YHH=1/0.37
1YHL=1/0.12
1YLH=1/0.12
1YHH=1/0.09
ここで、例えば、VTFにおける輝度Y成分と色差Cr成分と色差Cb成分との視覚特性の関係が4:2:1であったとすると、VTFの値の逆数における輝度Y成分と色差Cr成分と色差Cb成分との関係は、その逆数であるから1:2:4となる。
【0071】
従って、上記における色差Cr成分のVTFの値の逆数は、以下のようになる。
3CrLL=2/0.99
3CrHL=2/0.76
3CrLH=2/0.76
3CrHH=2/0.55
2CrHL=2/0.51
2CrLH=2/0.51
2CrHH=2/0.37
1CrHL=2/0.12
1CrLH=2/0.12
1CrHH=2/0.09
同様に、色差Cb成分のVTFの値の逆数は、以下のようになる。
3CbLL=4/0.99
3CbHL=4/0.76
3CbLH=4/0.76
3CbHH=4/0.55
2CbHL=4/0.51
2CbLH=4/0.51
2CbHH=4/0.37
1CbHL=4/0.12
1CbLH=4/0.12
1CbHH=4/0.09
ここで、ある1つのタイルにおける輝度Y成分のロスレスの符号量を、以下のように仮定する。
3YLLの符号量=A_y
3YHLの符号量=B_y
3YLHの符号量=C_y
3YHHの符号量=D_y
2YHLの符号量=E_y
2YLHの符号量=F_y
2YHHの符号量=G_y
1YHLの符号量=H_y
1YLHの符号量=I_y
1YHHの符号量=J_y
これにより、輝度Y成分のロスレスの符号量にVTFの逆数を乗じることで得られた正規化された符号量は、以下のようになる。
3YLL=A_y/0.99
3YHL=B_y/0.76
3YLH=C_y/0.76
3YHH=D_y/0.55
2YHL=E_y/0.51
2YLH=F_y/0.51
2YHH=G_y/0.37
1YHL=H_y/0.12
1YLH=I_y/0.12
1YHH=J_y/0.09
また、同じタイルにおける色差Cr成分のロスレスの符号量を、以下のように仮定する。
3CrLLの符号量=A_Cr
3CrHLの符号量=B_Cr
3CrLHの符号量=C_Cr
3CrHHの符号量=D_Cr
2CrHLの符号量=E_Cr
2CrLHの符号量=F_Cr
2CrHHの符号量=G_Cr
1CrHLの符号量=H_Cr
1CrLHの符号量=I_Cr
1CrHHの符号量=J_Cr
これにより、色差Cr成分のロスレスの符号量にVTFの逆数を乗じることでで得られてた正規化された符号量は、以下のようになる。
3CrLL=A_Cr・2/0.99
3CrHL=B_Cr・2/0.76
3CrLH=C_Cr・2/0.76
3CrHH=D_Cr・2/0.55
2CrHL=E_Cr・2/0.51
2CrLH=F_Cr・2/0.51
2CrHH=G_Cr・2/0.37
1CrHL=H_Cr・2/0.12
1CrLH=I_Cr・2/0.12
1CrHH=J_Cr・2/0.09
同様に、同じタイルにおける色差Cb成分のロスレスの符号量を、以下のように仮定する。
3CbLLの符号量=A_Cb
3CbHLの符号量=B_Cb
3CbLHの符号量=C_Cb
3CbHHの符号量=D_Cb
2CbHLの符号量=E_Cb
2CbLHの符号量=F_Cb
2CbHHの符号量=G_Cb
1CbHLの符号量=H_Cb
1CbLHの符号量=I_Cb
1CbHHの符号量=J_Cb
これにより、色差Cb成分のロスレスの符号量にVTFの逆数を乗じることで得られた正規化された符号量は、以下のようになる。
3CbLL=A_Cb・4/0.99
3CbHL=B_Cb・4/0.76
3CbLH=C_Cb・4/0.76
3CbHH=D_Cb・4/0.55
2CbHL=E_Cb・4/0.51
2CbLH=F_Cb・4/0.51
2CbHH=G_Cb・4/0.37
1CbHL=H_Cb・4/0.12
1CbLH=I_Cb・4/0.12
1CbHH=J_Cb・4/0.09
次に、全てのコンポーネント毎のサブバンドにおいて最も符号量の多いものから順に、削減すべき値に達する(=以下に示す所定の条件を満たす)まで符号量を削減していく。
【0072】
ここで、例えば、符号量の多い順を1CbHH>1CbLH>1CbHL>1CrHH>1YHH>1CrLH>…とし、また、上記の所定の条件を削減対象が最も符号量が多い状態から脱することとする。
【0073】
この場合、符号量削減処理は下記に(1)〜(5)の行程で示すような順序で行われる。尚、以下における各行程では、削減する度に、削減された符号量の合計が、削減すべき符号量に達しているか否かが判断される。
(1)まず、本実施例では、最も符号量の多い1CbHHを対象として符号量を削減していく。この処理は、1CbHHの符号量が現時点で2番目に符号量の多い1CbLHよりも少なくなるまで行う。この結果、符号量の多い順序が1CbLH>1CbHL>1CrHH>1YHH>1CrLH>1CbHH…のように変化するしたものとする。但し、削減後のICbHHの順位は2番目以降、任意の順位となる。
(2)次に、(1)の結果として最も符号量が多いものとなった1CbLHを対象として符号量を削減していく。この処理でも同様に、1CbLHの符号量が現時点で2番目に符号量の多い1CbHLよりも少なくなるまで行う。この結果、符号量の多い順序が1CbHL>1CrHH>1YHH>1CrLH>1CbHH>1CbLH…のように変化したものとする。
(3)次に、(2)の結果として最も符号量の多いものとなった1CbHLを対象として符号量を削減していく。この処理でも同様に、1CbHLの符号量が現時点で2番目に符号量の多い1CrHHよりも少なくなるまで行う。この結果、符号量の多い順序が1CrHH>1YHH>1CrLH>1CbHH>1CbLH>1CbHL…のように変化したものとする。
(4)次に、(3)の結果として最も符号量の多いものとなった1CrHHを対象として符号量を削減していく。この処理でも同様に、1CrHHの符号量が現時点で2番目に符号量の多い1YHHよりも少なくなるまで行う。この結果、符号量の多い順序が1YHH>1CrLH>1CbHH>1CbLH>1CrHH>1CbHL…のように変化したものとする。
(5)最後に、(4)の結果として最も符号量の多いものとなった1YHHを対象として符号量を削減していく。この処理でも同様に、1YHHの符号量が現時点で2番目に符号量の多い1CrLHよりも少なくなるまで行う。また、本実施例では、この段階までで、削減した符号量の総和が削減すべき符号量に達したものとする。従って、本実施例では、ここで符号量削減の処理が終了され、図5におけるステップS104へ移行する。
【0074】
また、以上の処理を実行することにより、輝度Y成分,色差Cb成分,色差Cr成分の符号量は、図6から図8に示すようになる。但し、図6から図8において、1本の棒グラフは、全体が削減する前の正規化された符号量を示し、棒グラフにおける白抜きの部分が削減分の符号量、又、棒グラフにおける黒塗りの部分が削減後の符号量を示している。
【0075】
このように、本実施例では、視覚特性を考慮した上で、全てのコンポーネント毎のサブバンド中で符号量の多いものから順に削減を行うため、原画像の特性を強く反映させることができる。また、このような構成は、上述したように比較的簡易な構成で実現することが可能である。
【0076】
尚、例えばJPEG2000のような、サブバンド毎の符号量をヘッダ情報として含む符号化方式では、一度得た符号から部分的に符号を破棄し、最終的な符号量を制御することは容易であるため、復号化する際に本実施例によるような符号量削減を行ってもよい。これによって、復号化時の処理速度が速くなり且つより画質を上げることができる。
【0077】
また、本実施例による画像符号化を実現するプログラムは、図1におけるHDD13等に予め格納されており、必要に応じて読み出され、RAM12に作業領域が確保されてCPU11において実行されるものである。
【0078】
また、このプログラムを、CD−ROM(CD−R,CD−RW等を含む)やDVD−RAM(DCD−RW等を含む)やMO等の持ち運び可能な記録媒体し、任意の端末に組み込めるようにするとよい。
〔第2の実施例〕
また、上記した第1の実施例とは異なり、削減する前の符号量と削減した後の符号量との比率をタイル毎に一定とするよう構成することも可能である。これを以下に第2の実施例として図面を用いて詳細に説明する。
【0079】
本実施例に係る画像符号化を実現する装置の構成例は、第1の実施例で示すもの(図1参照)と同様である。
【0080】
また、本実施例においても、第1の実施例と同様に、画像データを符号化する際、周波数領域に変換し、ロスレスのサブバンド全体のエントロピー符号化後、符号化後のデータに視覚的重みを考慮し、符号量の削減を実行する。この際の動作を図9を用いて以下に説明する。但し、本実施例でも、サブバンド符号化方式を採用した場合について説明する。
【0081】
図9を参照すると、本実施例では、まず、ステップS111として、画像データを128画素×128画素のタイルに分割し、それぞれに対して3回のウェーブレット変換を行う。これにより、図2に示すようなサブバンド構造を有するタイルが作成される。
【0082】
次に、ステップS112において、ステップS111で作成したタイルに対し、ロスレスのサブバンド全体のエントロピー符号化を行う。また、このエントロピー符号化により得られた符号量を保持する。保持する先としては、エントロピー符号化を行うエンコーダとする。但し、本実施例においてもエンコーダがCPU11及びRAM12によりプログラムを用いて実現されるために、保持先はRAM12となる。更に、ステップS112では、保持した符号量に対して個々に視覚系のMTF(VTF)の逆数を乗じることで正規化し、これにより得られた値(正規化された符号量)をRAM12に保持する。
【0083】
その後、ステップS113において、正規化された符号量を読み出し、これに基づいてコンポーネント毎のサブバンドの符号量比率を求め、削減すべき符号量の合計をそれぞれのコンポーネント毎のサブバンド全てに渡り、所定の条件を満たすまで、略同一の比率で配分し、削減を行う。この際の所定の条件としては、削減した符号量の合計値が、削減すべき符号量の値となることとする。
【0084】
また、ステップS111からステップS113までの処理は、全てのタイルに対して完了するまで繰り返し行われる(ステップS114)。
【0085】
この処理において、例えばJPEG2000のような符号化方式を用いた場合、パケットのヘッダ情報としてサブバンド毎のロスレスの符号量を含むため、このヘッダ情報からそれぞれの符号量を特定し、積算したものをパックトパケットヘッダに書きこむ。また正規化は、パックトパケットヘッダからそれぞれの符号量を読み出し、これに視覚系のMTF(VTF)の逆数を乗じることで行う。
【0086】
ここで、各サブバンドの周波数は、画像データの解像度と観察距離との関数になる。例えば、上記で触れた引用文献2に記載されているように、LL,HL,LH,HHの4つのサブバンドは異なるフーリエスペクトルを生じる。このため、各サブバンドに生じた誤差に対する視覚の感度は、サブバンド毎に異なると考えられている。上述において触れた引用文献2によれば、LL,HL,LH,HHの視覚の感度比は、おおよそ1:1/1.3:1/1.3:1/1.8となっている。
【0087】
そこで、本実施例では、周波数の違いによるVTFの値の差に加え、サブバンド毎の感度の違いも考慮に入れるよう構成する。
【0088】
例えば3LL,3HL,3LH,3HHの空間周波数を‘1’とした場合、2HL,2LH,2HHの空間周波数は‘2’となり,1HL,1LH,1HHの空間周波数は‘4’となる。
【0089】
また、第1の実施例で示したように、例えば上記した(式3),(式4),(式5)をそれぞれLL,(HL,LH),HHのVTFとして用いたとすると、その特性は図4に示すようになる。
【0090】
よって、上記での空間周波数に対する輝度Y成分のVTFの値は、以下のようになる。
3YLL=0.99
3YHL=0.76
3YLH=0.76
3YHH=0.55
2YHL=0.51
2YLH=0.51
2YHH=0.37
1YHL=0.12
1YLH=0.12
1YHH=0.09
また、輝度Y成分のVTFの値の逆数は、以下のようになる。
3YLL=1/0.99
3YHL=1/0.76
3YLH=1/0.76
3YHH=1/0.55
2YHL=1/0.51
2YLH=1/0.51
2YHH=1/0.37
1YHL=1/0.12
1YLH=1/0.12
1YHH=1/0.09
ここで、例えば、VTFにおける輝度Y成分と色差Cr成分と色差Cb成分との視覚特性の関係が4:2:1であったとすると、VTFの値の逆数における輝度Y成分と色差Cr成分と色差Cb成分との関係は、その逆数であるから1:2:4となる。
【0091】
従って、上記における色差Cr成分のVTFの値の逆数は、以下のようになる。
3CrLL=2/0.99
3CrHL=2/0.76
3CrLH=2/0.76
3CrHH=2/0.55
2CrHL=2/0.51
2CrLH=2/0.51
2CrHH=2/0.37
1CrHL=2/0.12
1CrLH=2/0.12
1CrHH=2/0.09
同様に、色差Cb成分のVTFの値の逆数は、以下のようになる。
3CbLL=4/0.99
3CbHL=4/0.76
3CbLH=4/0.76
3CbHH=4/0.55
2CbHL=4/0.51
2CbLH=4/0.51
2CbHH=4/0.37
1CbHL=4/0.12
1CbLH=4/0.12
1CbHH=4/0.09
ここで、ある1つのタイルにおける輝度Y成分のロスレスの符号量を、以下のように仮定する。
3YLLの符号量=A_y
3YHLの符号量=B_y
3YLHの符号量=C_y
3YHHの符号量=D_y
2YHLの符号量=E_y
2YLHの符号量=F_y
2YHHの符号量=G_y
1YHLの符号量=H_y
1YLHの符号量=I_y
1YHHの符号量=J_y
これにより、輝度Y成分のロスレスの符号量にVTFの逆数を乗じることで得られた正規化された符号量は、以下のようになる。
3YLL=A_y/0.99
3YHL=B_y/0.76
3YLH=C_y/0.76
3YHH=D_y/0.55
2YHL=E_y/0.51
2YLH=F_y/0.51
2YHH=G_y/0.37
1YHL=H_y/0.12
1YLH=I_y/0.12
1YHH=J_y/0.09
また、同じタイルにおける色差Cr成分のロスレスの符号量を、以下のように仮定する。
3CrLLの符号量=A_Cr
3CrHLの符号量=B_Cr
3CrLHの符号量=C_Cr
3CrHHの符号量=D_Cr
2CrHLの符号量=E_Cr
2CrLHの符号量=F_Cr
2CrHHの符号量=G_Cr
1CrHLの符号量=H_Cr
1CrLHの符号量=I_Cr
1CrHHの符号量=J_Cr
これにより、色差Cr成分のロスレスの符号量にVTFの逆数を乗じることで得られた正規化された符号量は、以下のようになる。
3CrLL=A_Cr・2/0.99
3CrHL=B_Cr・2/0.76
3CrLH=C_Cr・2/0.76
3CrHH=D_Cr・2/0.55
2CrHL=E_Cr・2/0.51
2CrLH=F_Cr・2/0.51
2CrHH=G_Cr・2/0.37
1CrHL=H_Cr・2/0.12
1CrLH=I_Cr・2/0.12
1CrHH=J_Cr・2/0.09
同様に、同じタイルにおける色差Cb成分のロスレスの符号量を、以下のように仮定する。
3CbLLの符号量=A_Cb
3CbHLの符号量=B_Cb
3CbLHの符号量=C_Cb
3CbHHの符号量=D_Cb
2CbHLの符号量=E_Cb
2CbLHの符号量=F_Cb
2CbHHの符号量=G_Cb
1CbHLの符号量=H_Cb
1CbLHの符号量=I_Cb
1CbHHの符号量=J_Cb
これにより、色差Cb成分のロスレスの符号量にVTFの逆数を乗じることで得られた正規化された符号量は、以下のようになる。
3CbLL=A_Cb・4/0.99
3CbHL=B_Cb・4/0.76
3CbLH=C_Cb・4/0.76
3CbHH=D_Cb・4/0.55
2CbHL=E_Cb・4/0.51
2CbLH=F_Cb・4/0.51
2CbHH=G_Cb・4/0.37
1CbHL=H_Cb・4/0.12
1CbLH=I_Cb・4/0.12
1CbHH=J_Cb・4/0.09
次に、各コンポーネント毎のサブバンドに対し、視覚特性に基づいた符号量(但し、視覚特性を考慮しない場合であってもよい:以下、視覚特性を考慮しない場合を省いて説明する)の比と略同じ比率で符号量を削減する。これは、上述したように、削減した符号量の総和が削減すべき符号量に達するまで行われる。
【0092】
ここで、上述から導き出せるように、全域における視覚特性に基づいた符号量の比は、以下のようになる。
3YLL:3YHL:3YLH:3YHH:2YHL:2YLH:2YHH:1YHL:1YLH:1YHH:3CrLL:3CrHL:3CrLH:3CrHH:2CrHL:2CrLH:2CrHH:1CrHL:1CrLH:1CrHH:3CbLL:3CbHL:3CbLH:3CbHH:2CbHL:2CbLH:2CbHH:1CbHL:1CbLH:1CbHH=A_y/0.99:B_y/0.76:C_y/0.76:D_y/0.55:E_y/0.51:F_y/0.51:G_y/0.37:H_y/0.12:I_y/0.12:J_y/0.09:A_Cr・2/0.99:B_Cr・2/0.76:C_Cr・2/0.76:D_Cr・2/0.55:E_Cr・2/0.51:F_Cr・2/0.51:G_Cr・2/0.37:H_Cr・2/0.12:I_Cr・2/0.12:J_Cr・2/0.09:A_Cb・4/0.99:B_Cb・4/0.76:C_Cb・4/0.76:D_Cb・4/0.55:E_Cb・4/0.51:F_Cb・4/0.51:G_Cb・4/0.37:H_Cb・4/0.12:I_Cb・4/0.12:J_Cb・4/0.09
従って、全ての比率の総和αは、以下のようになる。
α=A_y/0.99+B_y/0.76+C_y/0.76+D_y/0.55+E_y/0.51+F_y/0.51+G_y/0.37+H_y/0.12+I_y/0.12+J_y/0.09+A_Cr・2/0.99+B_Cr・2/0.76+C_Cr・2/0.76+D_Cr・2/0.55+E_Cr・2/0.51+F_Cr・2/0.51+G_Cr・2/0.37+H_Cr・2/0.12+I_Cr・2/0.12+J_Cr・2/0.09+A_Cb・4/0.99+B_Cb・4/0.76+C_Cb・4/0.76+D_Cb・4/0.55+E_Cb・4/0.51+F_Cb・4/0.51+G_Cb・4/0.37+H_Cb・4/0.12+I_Cb・4/0.12+J_Cb・4/0.09
また、削減すべき総符号量をβとすると、削減すべき符号量はそれぞれ、以下のようになる。
3YLL=(A_y/0.99)/(α/β)
3YHL=(B_y/0.76)/(α/β)
3YLH=(C_y/0.76)/(α/β)
3YHH=(D_y/0.55)/(α/β)
2YHL=(E_y/0.51)/(α/β)
2YLH=(F_y/0.51)/(α/β)
2YHH=(G_y/0.37)/(α/β)
1YHL=(H_y/0.12)/(α/β)
1YLH=(I_y/0.12)/(α/β)
1YHH=(J_y/0.09)/(α/β)
3CrLL=(A_Cr・2/0.99)/(α/β)
3CrHL=(B_Cr・2/0.76)/(α/β)
3CrLH=(C_Cr・2/0.76)/(α/β)
3CrHH=(D_Cr・2/0.55)/(α/β)
2CrHL=(E_Cr・2/0.51)/(α/β)
2CrLH=(F_Cr・2/0.51)/(α/β)
2CrHH=(G_Cr・2/0.37)/(α/β)
1CrHL=(H_Cr・2/0.12)/(α/β)
1CrLH=(I_Cr・2/0.12)/(α/β)
1CrHH=(J_Cr・2/0.09)/(α/β)
3CbLL=(A_Cb・4/0.99)/(α/β)
3CbHL=(B_Cb・4/0.76)/(α/β)
3CbLH=(C_Cb・4/0.76)/(α/β)
3CbHH=(D_Cb・4/0.55)/(α/β)
2CbHL=(E_Cb・4/0.51)/(α/β)
2CbLH=(F_Cb・4/0.51)/(α/β)
2CbHH=(G_Cb・4/0.37)/(α/β)
1CbHL=(H_Cb・4/0.12)/(α/β)
1CbLH=(I_Cb・4/0.12)/(α/β)
1CbHH=(J_Cb・4/0.09)/(α/β)
以上のような処理を実行することにより、輝度Y成分,色差Cb成分,色差Cr成分の符号量は、図10から図12に示すようになる。但し、図6から図8と同様に図10から図12において、1本の棒グラフは、全体が削減する前の正規化された符号量を示し、棒グラフにおける白抜きの部分が削減分の符号量、又、棒グラフにおける黒塗りの部分が削減後の符号量を示している。
【0093】
このように、全域に渡り、符号量又は、視覚特性に基づいた符号量の比と略同じ比率によって符号量を削減することで、ノイズ成分による影響が低減される。また、符号量を削減する前の符号量と削減した後の符号量との比率をタイル毎に一定とすることで、タイル毎の画質劣化を一定とすることが可能となり、バランスの取れた画像を得ることができる。
【0094】
尚、例えばJPEG2000の様な、サブバンド毎の符号量をヘッダ情報として含む符号化方式では、一度得た符号から部分的に符号を破棄し、最終的な符号量を制御することは容易であるため、復号化する際に本実施例によるような符号量削減を行ってもよい。これによって、復号化時の処理速度が速くなり且つより画質を上げることができる。
【0095】
また、本実施例による画像符号化を実現するプログラムは、図1におけるHDD13等に予め格納されており、必要に応じて読み出され、RAM12に作業領域が確保されてCPU11において実行されるものである。
【0096】
また、このプログラムを、CD−ROM(CD−R,CD−RW等を含む)やDVD−RAM(DCD−RW等を含む)やMO等の持ち運び可能な記録媒体し、任意の端末に組み込めるようにするとよい。
〔第3の実施例〕
また、第2の実施例において、符号量の削減時に、それぞれ配分された削減すべき符号量と正規化された符号量とを比較し、これに基づいて削減方法を選択するようにも構成することができる。以下、このように構成したものを、第3の実施例として図面を用いて詳細に説明する。
【0097】
本実施例に係る画像符号化を実現する装置の構成例は、第1の実施例で示すもの(図1参照)と同様である。
【0098】
また、本実施例においても、第1の実施例と同様に、画像データを符号化する際、周波数領域に変換し、ロスレスのサブバンド全体のエントロピー符号化後、符号化後のデータに視覚的重みを考慮し、符号量の削減を実行する。この際の動作を図13を用いて詳細に説明する。但し、本実施例でも、サブバンド符号化方式を採用した場合について説明する。
【0099】
図13を参照すると、本実施例では、まず、ステップS121として、画像データを128画素×128画素のタイルに分割し、それぞれに対して3回のウェーブレット変換を行う。これにより、図2に示すようなサブバンド構造を有するタイルが作成される。
【0100】
次に、ステップS122において、ステップS121で作成したタイルに対し、ロスレスのサブバンド全体のエントロピー符号化を行う。また、このエントロピー符号化により得られた符号量を保持する。保持する先としては、エントロピー符号化を行うエンコーダとする。但し、本実施例においてもエンコーダがCPU11及びRAM12によりプログラムを用いて実現されるために、保持先はRAM12となる。更に、ステップS122では、保持した符号量に対して個々に視覚系のMTF(VTF)の逆数を乗じることで正規化し、これにより得られた値(正規化された符号量)をRAM12に保持する。
【0101】
その後、ステップS123において、正規化された符号量を読み出し、これに基づいてコンポーネント毎のサブバンドの符号量比率を求め、削減すべき符号量の合計を、同一の比率でコンポーネント毎のサブバンドに分配する。
【0102】
このように削減すべき符号量をコンポーネント毎のサブバンドに分配すると、ステップS124において、各コンポーネント毎のサブバンドに、正規化された符号量が分配した削減すべき符号量以上であるか否かが判定される。
【0103】
この判定の結果、全てのコンポーネント毎のサブバンドにおいて正規化された符号量が分配された削減すべき符号量よりも多い場合(ステップS124のYes)、ステップS125において、分配された削減すべき符号量を正規化された符号量より削減する。これに対し、何れかのサブバンドにおいて正規化された符号量が分配された符号量よりも少ない場合(ステップS124のNo)、例えば図5のステップS103や、図9のステップS113で説明した処理により、各コンポーネント毎のサブバンドの符号量を削減する。
【0104】
また、ステップS121からステップS127までの処理は、全てのタイルに対して完了するまで繰り返し行われる(ステップS125)。
【0105】
この処理において、例えばJPEG2000のような符号化方式を用いた場合、パケットのヘッダ情報としてサブバンド毎のロスレスの符号量を含むため、このヘッダ情報からそれぞれの符号量を特定し、積算したものをパックトパケットヘッダに書きこむ。また正規化は、パックトパケットヘッダからそれぞれの符号量を読み出し、これに視覚系のMTF(VTF)の逆数を乗じることで行う。
【0106】
ここで、各サブバンドの周波数は、画像データの解像度と観察距離との関数になる。例えば、上記で触れた引用文献2に記載されているように、LL,HL,LH,HHの4つのサブバンドは異なるフーリエスペクトルを生じる。このため、各サブバンドに生じた誤差に対する視覚の感度は、サブバンド毎に異なると考えられている。上述において触れた引用文献2によれば、LL,HL,LH,HHの視覚の感度比は、おおよそ1:1/1.3:1/1.3:1/1.8となっている。
【0107】
そこで、本実施例では、周波数の違いによるVTFの値の差に加え、サブバンド毎の感度の違いも考慮に入れるよう構成する。
【0108】
例えば3LL,3HL,3LH,3HHの空間周波数を‘1’とした場合、2HL,2LH,2HHの空間周波数は‘2’となり,1HL,1LH,1HHの空間周波数は‘4’となる。
【0109】
また、第1の実施例で示したように、例えば上記した(式3),(式4),(式5)をそれぞれLL,(HL,LH),HHのVTFとして用いたとすると、その特性は図4に示すようになる。
【0110】
よって、上記での空間周波数に対する輝度Y成分のVTFの値は、以下のようになる。
3YLL=0.99
3YHL=0.76
3YLH=0.76
3YHH=0.55
2YHL=0.51
2YLH=0.51
2YHH=0.37
1YHL=0.12
1YLH=0.12
1YHH=0.09
また、輝度Y成分のVTFの値の逆数は、以下のようになる。
3YLL=1/0.99
3YHL=1/0.76
3YLH=1/0.76
3YHH=1/0.55
2YHL=1/0.51
2YLH=1/0.51
2YHH=1/0.37
1YHL=1/0.12
1YLH=1/0.12
1YHH=1/0.09
ここで、例えば、VTFにおける輝度Y成分と色差Cr成分と色差Cb成分との視覚特性の関係が4:2:1であったとすると、VTFの値の逆数における輝度Y成分と色差Cr成分と色差Cb成分との関係は、その逆数であるから1:2:4となる。
【0111】
従って、上記における色差Cr成分のVTFの値の逆数は、以下のようになる。
3CrLL=2/0.99
3CrHL=2/0.76
3CrLH=2/0.76
3CrHH=2/0.55
2CrHL=2/0.51
2CrLH=2/0.51
2CrHH=2/0.37
1CrHL=2/0.12
1CrLH=2/0.12
1CrHH=2/0.09
同様に、色差Cb成分のVTFの値の逆数は、以下のようになる。
3CbLL=4/0.99
3CbHL=4/0.76
3CbLH=4/0.76
3CbHH=4/0.55
2CbHL=4/0.51
2CbLH=4/0.51
2CbHH=4/0.37
1CbHL=4/0.12
1CbLH=4/0.12
1CbHH=4/0.09
ここで、ある1つのタイルにおける輝度Y成分のロスレスの符号量を、以下のように仮定する。
3YLLの符号量=A_y
3YHLの符号量=B_y
3YLHの符号量=C_y
3YHHの符号量=D_y
2YHLの符号量=E_y
2YLHの符号量=F_y
2YHHの符号量=G_y
1YHLの符号量=H_y
1YLHの符号量=I_y
1YHHの符号量=J_y
これにより、輝度Y成分のロスレスの符号量にVTFの逆数を乗じることで得られた正規化された符号量は、以下のようになる。
3YLL=A_y/0.99
3YHL=B_y/0.76
3YLH=C_y/0.76
3YHH=D_y/0.55
2YHL=E_y/0.51
2YLH=F_y/0.51
2YHH=G_y/0.37
1YHL=H_y/0.12
1YLH=I_y/0.12
1YHH=J_y/0.09
また、同じタイルにおける色差Cr成分のロスレスの符号量を、以下のように仮定する。
3CrLLの符号量=A_Cr
3CrHLの符号量=B_Cr
3CrLHの符号量=C_Cr
3CrHHの符号量=D_Cr
2CrHLの符号量=E_Cr
2CrLHの符号量=F_Cr
2CrHHの符号量=G_Cr
1CrHLの符号量=H_Cr
1CrLHの符号量=I_Cr
1CrHHの符号量=J_Cr
これにより、色差Cr成分のロスレスの符号量にVTFの逆数を乗じることで得られた正規化された符号量は、以下のようになる。
3CrLL=A_Cr・2/0.99
3CrHL=B_Cr・2/0.76
3CrLH=C_Cr・2/0.76
3CrHH=D_Cr・2/0.55
2CrHL=E_Cr・2/0.51
2CrLH=F_Cr・2/0.51
2CrHH=G_Cr・2/0.37
1CrHL=H_Cr・2/0.12
1CrLH=I_Cr・2/0.12
1CrHH=J_Cr・2/0.09
同様に、同じタイルにおける色差Cb成分のロスレスの符号量を、以下のように仮定する。
3CbLLの符号量=A_Cb
3CbHLの符号量=B_Cb
3CbLHの符号量=C_Cb
3CbHHの符号量=D_Cb
2CbHLの符号量=E_Cb
2CbLHの符号量=F_Cb
2CbHHの符号量=G_Cb
1CbHLの符号量=H_Cb
1CbLHの符号量=I_Cb
1CbHHの符号量=J_Cb
これにより、色差Cb成分のロスレスの符号量にVTFの逆数を乗じることで得られた正規化された符号量は、以下のようになる。
3CbLL=A_Cb・4/0.99
3CbHL=B_Cb・4/0.76
3CbLH=C_Cb・4/0.76
3CbHH=D_Cb・4/0.55
2CbHL=E_Cb・4/0.51
2CbLH=F_Cb・4/0.51
2CbHH=G_Cb・4/0.37
1CbHL=H_Cb・4/0.12
1CbLH=I_Cb・4/0.12
1CbHH=J_Cb・4/0.09
次に、各コンポーネント毎のサブバンドに対し、視覚特性に基づいた符号量の比と略同じ比率となるような削減すべき符号量を配分する。これは、上述したように、削減した符号量の総和が削減すべき符号量に達するように配分される。
【0112】
ここで、上述から導き出せるように、全域における視覚特性に基づいた符号量の比は、以下のようになる。
3YLL:3YHL:3YLH:3YHH:2YHL:2YLH:2YHH:1YHL:1YLH:1YHH:3CrLL:3CrHL:3CrLH:3CrHH:2CrHL:2CrLH:2CrHH:1CrHL:1CrLH:1CrHH:3CbLL:3CbHL:3CbLH:3CbHH:2CbHL:2CbLH:2CbHH:1CbHL:1CbLH:1CbHH=A_y/0.99:B_y/0.76:C_y/0.76:D_y/0.55:E_y/0.51:F_y/0.51:G_y/0.37:H_y/0.12:I_y/0.12:J_y/0.09:A_Cr・2/0.99:B_Cr・2/0.76:C_Cr・2/0.76:D_Cr・2/0.55:E_Cr・2/0.51:F_Cr・2/0.51:G_Cr・2/0.37:H_Cr・2/0.12:I_Cr・2/0.12:J_Cr・2/0.09:A_Cb・4/0.99:B_Cb・4/0.76:C_Cb・4/0.76:D_Cb・4/0.55:E_Cb・4/0.51:F_Cb・4/0.51:G_Cb・4/0.37:H_Cb・4/0.12:I_Cb・4/0.12:J_Cb・4/0.09
従って、全ての比率の総和αは、以下のようになる。
α=A_y/0.99+B_y/0.76+C_y/0.76+D_y/0.55+E_y/0.51+F_y/0.51+G_y/0.37+H_y/0.12+I_y/0.12+J_y/0.09+A_Cr・2/0.99+B_Cr・2/0.76+C_Cr・2/0.76+D_Cr・2/0.55+E_Cr・2/0.51+F_Cr・2/0.51+G_Cr・2/0.37+H_Cr・2/0.12+I_Cr・2/0.12+J_Cr・2/0.09+A_Cb・4/0.99+B_Cb・4/0.76+C_Cb・4/0.76+D_Cb・4/0.55+E_Cb・4/0.51+F_Cb・4/0.51+G_Cb・4/0.37+H_Cb・4/0.12+I_Cb・4/0.12+J_Cb・4/0.09
また、削減すべき総符号量をβとすると、削減すべき符号量配分はそれぞれ、以下のようになる。
3YLL=(A_y/0.99)/(α/β)
3YHL=(B_y/0.76)/(α/β)
3YLH=(C_y/0.76)/(α/β)
3YHH=(D_y/0.55)/(α/β)
2YHL=(E_y/0.51)/(α/β)
2YLH=(F_y/0.51)/(α/β)
2YHH=(G_y/0.37)/(α/β)
1YHL=(H_y/0.12)/(α/β)
1YLH=(I_y/0.12)/(α/β)
1YHH=(J_y/0.09)/(α/β)
3CrLL=(A_Cr・2/0.99)/(α/β)
3CrHL=(B_Cr・2/0.76)/(α/β)
3CrLH=(C_Cr・2/0.76)/(α/β)
3CrHH=(D_Cr・2/0.55)/(α/β)
2CrHL=(E_Cr・2/0.51)/(α/β)
2CrLH=(F_Cr・2/0.51)/(α/β)
2CrHH=(G_Cr・2/0.37)/(α/β)
1CrHL=(H_Cr・2/0.12)/(α/β)
1CrLH=(I_Cr・2/0.12)/(α/β)
1CrHH=(J_Cr・2/0.09)/(α/β)
3CbLL=(A_Cb・4/0.99)/(α/β)
3CbHL=(B_Cb・4/0.76)/(α/β)
3CbLH=(C_Cb・4/0.76)/(α/β)
3CbHH=(D_Cb・4/0.55)/(α/β)
2CbHL=(E_Cb・4/0.51)/(α/β)
2CbLH=(F_Cb・4/0.51)/(α/β)
2CbHH=(G_Cb・4/0.37)/(α/β)
1CbHL=(H_Cb・4/0.12)/(α/β)
1CbLH=(I_Cb・4/0.12)/(α/β)
1CbHH=(J_Cb・4/0.09)/(α/β)
ここで、本実施例では第2の実施例と相違して、それぞれ配分された削減すべき符号量を正規化された符号量と比較する。
【0113】
この結果、例えば全てのコンポーネント毎のサブバンドにおいて符号量が少ないという結果が得られた場合、配分された削減すべき符号量に基づき符号量を削減するよう動作する。
【0114】
また、何れかのコンポーネント毎のサブバンドにおいて符号量が不足していると判定された場合、本実施例では第1又は第2の実施例で説明したような方法により、各コンポーネント毎のサブバンドより所定の符号量を削減する処理を実行する。
【0115】
以上のような処理を実行することにより、輝度Y成分,色差Cb成分,色差Cr成分の符号量は、図14から図16に示すようになる。但し、図6から図8と同様に図14から図16において、1本の棒グラフは、全体が削減する前の正規化された符号量を示し、棒グラフにおける白抜きの部分が削減分の符号量、又、棒グラフにおける黒塗りの部分が削減後の符号量を示している。
【0116】
このように全域に渡り、視覚特性に基づいた符号量の比と略同じ比率によって符号量を削減することで、ノイズ成分による影響が低減される。また、符号量を削減する前の符号量と削減した後の符号量との比率をタイル毎に一定とすることで、タイル毎の画質劣化を一定とすることが可能となり、バランスの取れた画像を得ることができる。更に、削減にあたり不足した分の符号量を、視覚的に鈍感な帯域から順に削減するよう構成することで、より画質劣化を抑えることが可能となる。
【0117】
尚、例えばJPEG2000の様な、サブバンド毎の符号量をヘッダ情報として含む符号化方式では、一度得た符号から部分的に符号を破棄し、最終的な符号量を制御することは容易であるため、復号化する際に本実施例によるような符号量削減を行ってもよい。これによって、復号化時の処理速度が速くなり且つより画質を上げることができる。
【0118】
また、本実施例による画像符号化を実現するプログラムは、図1におけるHDD13等に予め格納されており、必要に応じて読み出され、RAM12に作業領域が確保されてCPU11において実行されるものである。
【0119】
また、このプログラムを、CD−ROM(CD−R,CD−RW等を含む)やDVD−RAM(DCD−RW等を含む)やMO等の持ち運び可能な記録媒体し、任意の端末に組み込めるようにするとよい。
〔第4の実施例〕
また、上記第3の実施例では、それぞれ配分された削減すべき符号量を正規化された符号量と比較した結果、全てのサブバンドにおいて符号量が少ないという結果が得られた場合に全ての周波数領域において同一の比率で符号量を削減するよう構成されている。これに対し、上記比較の結果、符号量が削減する分に対し不足する場合、余った削減すべき符号量を他の周波数領域に割り当てるよう構成することも可能である。以下、これを第4の実施例として図面を用いて詳細に説明する。
【0120】
本実施例に係る画像符号化を実現する装置の構成例は、第1の実施例で示すもの(図1参照)と同様であるため、ここでは説明を省略する。
【0121】
また、本実施例においても、第1の実施例と同様に、画像データを符号化する際、周波数領域に変化し、ロスレスのサブバンド全体のエントロピー符号化後、符号化後のデータに視覚的重みを考慮し、符号量の削減を実行する。この際の動作を図17を用いて以下に説明する。但し、本実施例でも、サブバンド符号化方式を採用した場合について説明する。
【0122】
図17を参照すると、本実施例では、まず、ステップS131として、画像データを128画素×128画素のタイルに分割し、それぞれに対して3回のウェーブレット変換を行う。これにより、図2に示すようなサブバンド構造を有するタイルが作成される。
【0123】
次に、ステップS132において、ステップS131で作成したタイルに対し、ロスレスのサブバンド全体のエントロピー符号化を行う。また、このエントロピー符号化により得られた符号量を保持する。保持する先としては、エントロピー符号化を行うエンコーダとする。但し、本実施例においてもエンコーダがCPU11及びRAM12によりプログラムを用いて実現されるために、保持先はRAM12となる。更に、ステップS132では、保持した符号量に対して個々に視覚右傾のMTF(VTF)の逆数を乗じることで正規化し、これにより得られた値(正規化された符号量)をRAM12に保持する。
【0124】
その後、ステップS133において、正規化された符号量を読み出し、これに基づいてコンポーネント毎のサブバンドの符号量比率を求め、削減すべき符号量の合計を、同一の比率でコンポーネント毎のサブバンドに分配する。
【0125】
このように削減すべき符号量をコンポーネント毎のサブバンドに分配すると、ステップS134において、各コンポーネント毎のサブバンドに、正規化された符号量が分配した削減すべき符号量以上であるか否かが判定される。
【0126】
この判定の結果、全てのコンポーネント毎のサブバンドにおいて正規化された符号量が分配された削減すべき符号量よりも多い場合(ステップS134のYes)、ステップS135において、分配された削減すべき符号量を正規化された符号量より削減する。これに対し、何れかのコンポーネント毎のサブバンドにおいて正規化された符号量が分配された符号量よりも少ない場合(ステップS134のNo)、ステップS137において不足した削減すべき符号量分を、他のコンポーネント毎のサブバンドから削減する。これは、不足分全てが補われるまで、例えば高域から順に削減するように構成される。
【0127】
また、ステップS131からステップS137までの処理は、全てのタイルに対して完了するまで、繰り返し行われる(ステップS136)。
【0128】
この処理において、例えばJPEG2000のような符号化方式を用いた場合、パケットのヘッダ情報としてサブバンド毎のロスレスの符号量を含むため、このヘッダ情報からそれぞれの符号量を特定し、積算したものをパックトパケットヘッダに書き込む。また、正規化は、パックトパケットヘッダからそれぞれの符号量を読み出し、これに視覚系のMTF(VTF)の逆数を乗じることで行う。
【0129】
ここで、各サブバンドの周波数は、画像データの解像度と観察距離との関数になる。例えば、上記で触れた引用文献2に記載されているように、LL,HL,LH,HHの4つのサブバンドは異なるフーリエスペクトルを生じる。このため、各サブバンドに生じた誤差に対する視覚の感度は、サブバンド毎に異なると考えられている。上述において触れた引用文献2によれば、LL,HL,LH,HHの視覚の感度比は、おおよそ1:1/1.3:1/1.3:1/1.8となっている。
【0130】
そこで、本実施例では、周波数の違いによるVTFの値の差に加え、サブバンドごとの感度の違いも考慮に入れるよう構成する。
【0131】
例えば3LL,3HL,3LH,3HHの空間周波数を‘1’とした場合、2HL,2LH,2HHの空間周波数は‘2’,1HL,1LH,1HHの空間周波数は‘4’となる。
【0132】
また、第1の実施例で示したように、例えば上記した(式3),(式4),(式5)をそれぞれLL,(HL,LH),HHのVTFとして用いたとすると、その特性は図4に示すようになる。
【0133】
よって、上記での空間周波数に対する輝度Y成分のVTFの値は、以下のようになる。
3YLL=0.99
3YHL=0.76
3YLH=0.76
3YHH=0.55
2YHL=0.51
2YLH=0.51
2YHH=0.37
1YHL=0.12
1YLH=0.12
1YHH=0.09
また、輝度Y成分のVTFの値の逆数は、以下のようになる。
3YLL=1/0.99
3YHL=1/0.76
3YLH=1/0.76
3YHH=1/0.55
2YHL=1/0.51
2YLH=1/0.51
2YHH=1/0.37
1YHL=1/0.12
1YLH=1/0.12
1YHH=1/0.09
ここで、例えば、VTFにおける輝度Y成分と色差Cr成分と色差Cb成分との視覚特性の関係が4:2:1であったとすると、VTFの値の逆数における輝度Y成分と色差Cr成分と色差Cb成分との関係は、その逆数であるから1:2:4となる。
【0134】
従って、上記における色差Cr成分のVTFの値の逆数は、以下のようになる。
3CrLL=2/0.99
3CrHL=2/0.76
3CrLH=2/0.76
3CrHH=2/0.55
2CrHL=2/0.51
2CrLH=2/0.51
2CrHH=2/0.37
1CrHL=2/0.12
1CrLH=2/0.12
1CrHH=2/0.09
同様に、色差Cb成分のVTFの値の逆数は、以下のようになる。
3CbLL=4/0.99
3CbHL=4/0.76
3CbLH=4/0.76
3CbHH=4/0.55
2CbHL=4/0.51
2CbLH=4/0.51
2CbHH=4/0.37
1CbHL=4/0.12
1CbLH=4/0.12
1CbHH=4/0.09
ここで、ある1つのタイルにおける輝度Y成分のロスレスの符号量を、以下のように仮定する。
3YLLの符号量=A_y
3YHLの符号量=B_y
3YLHの符号量=C_y
3YHHの符号量=D_y
2YHLの符号量=E_y
2YLHの符号量=F_y
2YHHの符号量=G_y
1YHLの符号量=H_y
1YLHの符号量=I_y
1YHHの符号量=J_y
これにより、輝度Y成分のロスレスの符号量にVTFの逆数を乗じることで得られた正規化された符号量は、以下のようになる。
3YLL=A_y/0.99
3YHL=B_y/0.76
3YLH=C_y/0.76
3YHH=D_y/0.55
2YHL=E_y/0.51
2YLH=F_y/0.51
2YHH=G_y/0.37
1YHL=H_y/0.12
1YLH=I_y/0.12
1YHH=J_y/0.09
また、同じタイルにおける色差Cr成分のロスレスの符号量を、以下のように仮定する。
3CrLLの符号量=A_Cr
3CrHLの符号量=B_Cr
3CrLHの符号量=C_Cr
3CrHHの符号量=D_Cr
2CrHLの符号量=E_Cr
2CrLHの符号量=F_Cr
2CrHHの符号量=G_Cr
1CrHLの符号量=H_Cr
1CrLHの符号量=I_Cr
1CrHHの符号量=J_Cr
これにより、色差Cr成分のロスレスの符号量にVTFの逆数を乗じることで得られた正規化された符号量は、以下のようになる。
3CrLL=A_Cr・2/0.99
3CrHL=B_Cr・2/0.76
3CrLH=C_Cr・2/0.76
3CrHH=D_Cr・2/0.55
2CrHL=E_Cr・2/0.51
2CrLH=F_Cr・2/0.51
2CrHH=G_Cr・2/0.37
1CrHL=H_Cr・2/0.12
1CrLH=I_Cr・2/0.12
1CrHH=J_Cr・2/0.09
同様に、同じタイルにおける色差Cb成分のロスレスの符号量を、以下のように仮定する。
3CbLLの符号量=A_Cb
3CbHLの符号量=B_Cb
3CbLHの符号量=C_Cb
3CbHHの符号量=D_Cb
2CbHLの符号量=E_Cb
2CbLHの符号量=F_Cb
2CbHHの符号量=G_Cb
1CbHLの符号量=H_Cb
1CbLHの符号量=I_Cb
1CbHHの符号量=J_Cb
これにより、色差Cb成分のロスレスの符号量にVTFの逆数を乗じることで得られた正規化された符号量は、以下のようになる。
3CbLL=A_Cb・4/0.99
3CbHL=B_Cb・4/0.76
3CbLH=C_Cb・4/0.76
3CbHH=D_Cb・4/0.55
2CbHL=E_Cb・4/0.51
2CbLH=F_Cb・4/0.51
2CbHH=G_Cb・4/0.37
1CbHL=H_Cb・4/0.12
1CbLH=I_Cb・4/0.12
1CbHH=J_Cb・4/0.09
次に、各コンポーネント毎のサブバンドに対し、視覚特性に基づいた符号量の比と略同じ比率となるような削減すべき符号量を配分する。これは、上述したように、削減した符号量の総和が削減すべき符号量に達するように配分される。
【0135】
ここで、上述から導き出せるように、全域における視覚特性に基づいた符号量の比は、以下のようになる。
3YLL:3YHL:3YLH:3YHH:2YHL:2YLH:2YHH:1YHL:1YLH:1YHH:3CrLL:3CrHL:3CrLH:3CrHH:2CrHL:2CrLH:2CrHH:1CrHL:1CrLH:1CrHH:3CbLL:3CbHL:3CbLH:3CbHH:2CbHL:2CbLH:2CbHH:1CbHL:1CbLH:1CbHH=A_y/0.99:B_y/0.76:C_y/0.76:D_y/0.55:E_y/0.51:F_y/0.51:G_y/0.37:H_y/0.12:I_y/0.12:J_y/0.09:A_Cr・2/0.99:B_Cr・2/0.76:C_Cr・2/0.76:D_Cr・2/0.55:E_Cr・2/0.51:F_Cr・2/0.51:G_Cr・2/0.37:H_Cr・2/0.12:I_Cr・2/0.12:J_Cr・2/0.09:A_Cb・4/0.99:B_Cb・4/0.76:C_Cb・4/0.76:D_Cb・4/0.55:E_Cb・4/0.51:F_Cb・4/0.51:G_Cb・4/0.37:H_Cb・4/0.12:I_Cb・4/0.12:J_Cb・4/0.09
従って、全ての比率の総和αは、以下のようになる。
α=A_y/0.99+B_y/0.76+C_y/0.76+D_y/0.55+E_y/0.51+F_y/0.51+G_y/0.37+H_y/0.12+I_y/0.12+J_y/0.09+A_Cr・2/0.99+B_Cr・2/0.76+C_Cr・2/0.76+D_Cr・2/0.55+E_Cr・2/0.51+F_Cr・2/0.51+G_Cr・2/0.37+H_Cr・2/0.12+I_Cr・2/0.12+J_Cr・2/0.09+A_Cb・4/0.99+B_Cb・4/0.76+C_Cb・4/0.76+D_Cb・4/0.55+E_Cb・4/0.51+F_Cb・4/0.51+G_Cb・4/0.37+H_Cb・4/0.12+I_Cb・4/0.12+J_Cb・4/0.09
また、削減すべき総符号量をβとすると、削減すべき符号量配分はそれぞれ、以下のようになる。
3YLL_γ=(A_y/0.99)/(α/β)
3YHL_γ=(B_y/0.76)/(α/β)
3YLH_γ=(C_y/0.76)/(α/β)
3YHH_γ=(D_y/0.55)/(α/β)
2YHL_γ=(E_y/0.51)/(α/β)
2YLH_γ=(F_y/0.51)/(α/β)
2YHH_γ=(G_y/0.37)/(α/β)
1YHL_γ=(H_y/0.12)/(α/β)
1YLH_γ=(I_y/0.12)/(α/β)
1YHH_γ=(J_y/0.09)/(α/β)
3CrLL_γ=(A_Cr・2/0.99)/(α/β)
3CrHL_γ=(B_Cr・2/0.76)/(α/β)
3CrLH_γ=(C_Cr・2/0.76)/(α/β)
3CrHH_γ=(D_Cr・2/0.55)/(α/β)
2CrHL_γ=(E_Cr・2/0.51)/(α/β)
2CrLH_γ=(F_Cr・2/0.51)/(α/β)
2CrHH_γ=(G_Cr・2/0.37)/(α/β)
1CrHL_γ=(H_Cr・2/0.12)/(α/β)
1CrLH_γ=(I_Cr・2/0.12)/(α/β)
1CrHH_γ=(J_Cr・2/0.09)/(α/β)
3CbLL_γ=(A_Cb・4/0.99)/(α/β)
3CbHL_γ=(B_Cb・4/0.76)/(α/β)
3CbLH_γ=(C_Cb・4/0.76)/(α/β)
3CbHH_γ=(D_Cb・4/0.55)/(α/β)
2CbHL_γ=(E_Cb・4/0.51)/(α/β)
2CbLH_γ=(F_Cb・4/0.51)/(α/β)
2CbHH_γ=(G_Cb・4/0.37)/(α/β)
1CbHL_γ=(H_Cb・4/0.12)/(α/β)
1CbLH_γ=(I_Cb・4/0.12)/(α/β)
1CbHH_γ=(J_Cb・4/0.09)/(α/β)
ここで、本実施例では第3の実施例と同様に、それぞれ配分された削減すべき符号量を正規化された符号量と比較する。
【0136】
この結果、例えば以下のように、1CbHHのみ符号量が多く、他のコンポーネント毎のサブバンドでは符号量が少ないという関係が導き出せたとする。
3YLL_γ≧A_y
3YHL_γ≧B_y
3YLH_γ≧C_y
3YHH_γ≧D_y
2YHL_γ≧E_y
2YLH_γ≧F_y
2YHH_γ≧G_y
1YHL_γ≧H_y
1YLH_γ≧I_y
1YHH_γ≧J_y
3CrLL_γ≧A_Cr
3CrHL_γ≧B_Cr
3CrLH_γ≧C_Cr
3CrHH_γ≧D_Cr
2CrHL_γ≧E_Cr
2CrLH_γ≧F_Cr
2CrHH_γ≧G_Cr
1CrHL_γ≧H_Cr
1CrLH_γ≧I_Cr
1CrHH_γ≧J_Cr
3CbLL_γ≧A_Cb
3CbHL_γ≧B_Cb
3CbLH_γ≧C_Cb
3CbHH_γ≧D_Cb
2CbHL_γ≧E_Cb
2CbLH_γ≧F_Cb
2CbHH_γ≧G_Cb
1CbHL_γ≧H_Cb
1CbLH_γ≧I_Cb
1CbHH_γ<J_Cb
ここで、配分された符号量と正規化された符号量の符号量差は下記のように表せられる。
A1_y=|3YLL_γ−A_y|
B1_y=|3YHL_γ−B_y|
C1_y=|3YLH_γ−C_y|
D1_y=|3YHH_γ−D_y|
E1_y=|2YHL_γ−E_y|
F1_y=|2YLH_γ−F_y|
G1_y=|2YHH_γ−G_y|
H1_y=|1YHL_γ−H_y|
I1_y=|1YLH_γ−I_y|
J1_y=|1YHH_γ−J_y|
A1_Cr=|3CrLL_γ−A_Cr|
B1_Cr=|3CrHL_γ−B_Cr|
C1_Cr=|3CrLH_γ−C_Cr|
D1_Cr=|3CrHH_γ−D_Cr|
E1_Cr=|2CrHL_γ−E_Cr|
F1_Cr=|2CrLH_γ−F_Cr|
G1_Cr=|2CrHH_γ−G_Cr|
H1_Cr=|1CrHL_γ−H_Cr|
I1_Cr=|1CrLH_γ−I_Cr|
J1_Cr=|1CrHH_γ−J_Cr|
A1_Cb=|3CbLL_γ−A_Cb|
B1_Cb=|3CbHL_γ−B_Cb|
C1_Cb=|3CbLH_γ−C_Cb|
D1_Cb=|3CbHH_γ−D_Cb|
E1_Cb=|2CbHL_γ−E_Cb|
F1_Cb=|2CbLH_γ−F_Cb|
G1_Cb=|2CbHH_γ−G_Cb|
H1_Cb=|1CbHL_γ−H_Cb|
I1_Cb=|1CbLH_γ−I_Cb|
J1_Cb=|1CbHH_γ−J_Cb|
ここで、不足した分である削減すべき符号量J1_Cbを、1CbHH以外のコンポーネント毎のサブバンドへ配分する必要がある。配分先のコンポーネント毎のサブバンドの順としては、高域からとした方がよい。これは、低域の符号量は削減しすぎてしまうと、急激な画質劣化をおこしてしまうためである。従って、例えば1CbHH,1CbLH,1CbHL,1CrHH,1CrLH,1CrHL,1YHH,1YLH,1YHL,2CbHH,2CbLH,2CbHL,2CrHH,2CrLH,2CrHL,…の順に配分していく。
【0137】
但し、1CbHH,1CbLH,1CbHL,1CrHH,1CrLH,1CrHL,2CbHH,2CbLH,2CbHL,2CrHH,2CrLH,2CrHL,1YHH,1YLH,1YHL,…のような順にしても良い。
【0138】
従って、1CbHH以外における最も高域のコンポーネント毎のサブバンドは1CbLHであるため、例えばJ1_Cb<I1_Cbであるとすると、1CbLHに配分される削減すべき符号量は1CbLH_γにJ1_Cbを加算した符号量となる。
【0139】
よって、最終的に1CbHHと1CbLHの削減すべき符号量の配分は、以下のようになる。
1CbLH_γ=(I_Cb・4/0.12)/(α/β)+J1_Cb
1CbHH_γ=(J_Cb・4/0.09)/(α/β)−J1_Cb
本実施例では、上記のような処理により求められた削減すべき符号量の配分に基づき、符号量削減を行う。
【0140】
以上のような処理を実行することにより、輝度Y成分,色差Cb成分,色差Cr成分の符号量は、図18から図20に示すようになる。但し、図6から図8と同様に図18から図20において、1本の棒グラフは、全体が正規化された符号量を示し、棒グラフにおける白抜きの部分が削減分の符号量、又、棒グラフにおける黒塗りの部分が削減後の符号量を示している。
【0141】
以上のような構成とすることで、本実施例では、2つの削減方法を適宜、使い分けることが可能となり、急激な画質劣化を低減させることができるようになる。
【0142】
尚、例えばJPEG2000の様な、サブバンド毎の符号量をヘッダ情報として含む符号化方式では、一度得た符号から部分的に符号を破棄し、最終的な符号量を制御することは容易である。このため、復号化する際にこの符号量削減を行ってもよい。これによって、復号化時の処理速度が速くなり且つより画質を上げることができる。
【0143】
また、本実施例による画像符号化を実現するプログラムは、図1におけるHDD13等に予め格納されており、必要に応じて読み出され、RAM12に作業領域が確保されてCPU11において実行されるものである。
【0144】
また、このプログラムを、CD−ROM(CD−R,CD−RW等を含む)やDVD−RAM(DCD−RW等を含む)やMO等の持ち運び可能な記録媒体し、任意の端末に組み込めるようにするとよい。
〔他の実施例〕
また、上記した各実施例では、ロスレスのサブバンド全体のエントロピー符号化を行う際の形態について例を挙げて説明したが、本発明ではこれに限定されず、エントロピー符号化の前行程として量子化を含むよう構成することも可能である。但し、この場合の構成は、上記した各実施例より容易に導き出すことができるため、説明を省略する。
【0145】
更に、上記した各実施例は、本発明を好適に実施した形態の一例に過ぎず、本発明は、その主旨を逸脱しない限り、種々変形して実施することが可能なものである。
【0146】
【発明の効果】
以上、説明したように、請求項1記載の発明によれば、視覚特性を反映させながら、原画像の符号量特性に基づいて精度良く符号量を削減する画像符号化装置を提供することが可能となる。
【0147】
また、請求項2記載の発明によれば、圧縮率を保ちつつ、コンポーネント毎に視覚特性を反映することで、より原画像の符号量特性に基づいて精度良く符号量を削減する画像符号化装置を提供することが可能となる。
【0148】
更に、請求項3記載の発明によれば、原画像の符号量特性に基づいて精度良く符号量を削減する画像符号化装置において、圧縮率によって符号量削減方法を変えることで、より画質劣化を低減させることが可能となる。
【0149】
更に、請求項4記載の発明によれば、原画像の符号量特性に基づいて精度良く符号量を削減する画像符号化装置において、急激な画質劣化を低減することが可能となる。
【0150】
更に、請求項5記載の発明によれば、原画像の符号量特性に基づいて精度良く符号量を削減する画像符号化装置において、よりバランスの取れた画質を得ることが可能となる。
【0151】
更に、請求項6記載の発明によれば、原画像の符号量特性に基づいて精度良く符号量を削減する画像符号化装置において、急激な画質劣化を低減させることが可能となる。
【0152】
更に、請求項7記載の発明によれば、視覚特性を反映させながら、原画像の符号量特性に基づいて精度良く符号量を削減する画像符号化方法を提供することが可能となる。
【0153】
更に、請求項8記載の発明によれば、圧縮率を保ちつつ、コンポーネント毎に視覚特性を反映することで、より原画像の符号量特性に基づいて精度良く符号量を削減する画像符号化方法を提供することが可能となる。
【0154】
更に、請求項9記載の発明によれば、原画像の符号量特性に基づいて精度良く符号量を削減する画像符号化方法において、圧縮率によって符号量削減方法を変えることで、より画質劣化を低減させることが可能となる。
更に、請求項10記載の発明によれば、原画像の符号量特性に基づいて精度良く符号量を削減する画像符号化方法において、急激な画質劣化を低減することが可能となる。
更に、請求項11記載の発明によれば、原画像の符号量特性に基づいて精度良く符号量を削減する画像符号化方法を提供することが可能となる。
更に、請求項12記載の発明によれば、原画像の符号量特性に基づいて精度良く符号量を削減する画像符号化方法において、急激な画質劣化を低減させることが可能となる。
【図面の簡単な説明】
【図1】 本発明の第1の実施例による画像符号化を実現する装置の構成を示すブロック図である。
【図2】 ウェーブレット変換により作成されるサブバンド構造を示す図である。
【図3】 サブバンド毎における知覚可能な量子誤差の最大値と周波数との関係を輝度Y,色差Cb,色差Cr毎に示すグラフである。
【図4】 空間周波数に対するVTFの関係をサブバンド毎に示すグラフである。
【図5】 本発明の第1の実施例における動作を示すフローチャートである。
【図6】 本発明の第1の実施例における輝度Y成分の符号量を示すグラフである。
【図7】 本発明の第1の実施例における色差Cr成分の符号量を示すグラフである。
【図8】 本発明の第1の実施例における色差Cb成分の符号量を示すグラフである。
【図9】 本発明の第2の実施例における動作を示すフローチャートである。
【図10】 本発明の第2の実施例における輝度Y成分の符号量を示すグラフである。
【図11】 本発明の第2の実施例における色差Cr成分の符号量を示すグラフである。
【図12】 本発明の第2の実施例における色差Cb成分の符号量を示すグラフである。
【図13】 本発明の第3の実施例における動作を示すフローチャートである。
【図14】 本発明の第3の実施例における輝度Y成分の符号量を示すグラフである。
【図15】 本発明の第3の実施例における色差Cr成分の符号量を示すグラフである。
【図16】 本発明の第3の実施例における色差Cb成分の符号量を示すグラフである。
【図17】 本発明の第4の実施例における動作を示すフローチャートである。
【図18】 本発明の第4の実施例における輝度Y成分の符号量を示すグラフである。
【図19】 本発明の第4の実施例における色差Cr成分の符号量を示すグラフである。
【図20】 本発明の第4の実施例における色差Cb成分の符号量を示すグラフである。
【符号の説明】
1 データバス
10 PC
11、21 CPU
12,22 RAM
13 HDD
20 プリンタ
A、A’ 原画像
B、B’ 圧縮画像
C 伸張画像

Claims (14)

  1. 周波数領域に変換された画像データを符号化する画像符号化装置であって、
    ロスレスのエントロピー符号化により得られた前記画像データの周波数領域毎の符号量の分布に基づき、符号量を削減する符号量削減手段を有し、
    前記エントロピー符号化により得られた周波数領域毎の符号量に、視覚伝達関数の逆数を乗じることで得られる値に基づき、符号量を削減することを特徴とする画像符号化装置。
  2. 周波数領域に変換された複数のコンポーネントからなる画像データを符号化する画像符号化装置であって、
    ロスレスのエントロピー符号化により得られた前記画像データの周波数領域毎の符号量の分布に基づき、符号量を削減する符号量削減手段を有し、
    前記エントロピー符号化により得られた周波数領域毎の符号量に対して、前記コンポーネント毎に視覚伝達関数の逆数を乗じることで得られる値に基づき、符号量を削減することを特徴とする画像符号化装置。
  3. 前記符号量削減手段は、低圧縮率である場合と高圧縮率である場合とで符号量の削減を変えることを特徴とする請求項1又は2に記載の画像符号化装置。
  4. 前記符号量削減手段は、ある一定の圧縮率までは全域に渡って平均的に符号量を削減し、前記圧縮率以上からは高域から順に符号量を削減することを特徴とする請求項3に記載の画像符号化装置。
  5. 前記符号量削減手段は、所定の圧縮率以下である場合、全域に渡って、前記符号量又は前記視覚特性に基づいた符号量の比と略同じ比率で符号量を削減することを特徴とする請求項3に記載の画像符号化装置。
  6. 前記符号量削減手段は、所定の圧縮率以上である場合、当該圧縮率までは、全域に渡って、前記符号量又は前記視覚特性に基づいた符号量の比と略同じ比率で符号量を削減することを特徴とする請求項3に記載の画像符号化装置。
  7. 周波数領域に変換された画像データを符号化する画像符号化方法であって、
    ロスレスのエントロピー符号化により得られた前記画像データの周波数領域毎の符号量の分布に基づき、符号量を削減する符号量削減工程を有し、
    前記エントロピー符号化により得られた周波数領域毎の符号量に、視覚伝達関数の逆数を乗じることで得られる値に基づき、符号量を削減することを特徴とする画像符号化方法。
  8. 周波数領域に変換された複数のコンポーネントからなる画像データを符号化する画像符号化方法であって、
    ロスレスのエントロピー符号化により得られた前記画像データの周波数領域毎の符号量の分布に基づき、符号量を削減する符号量削減工程を有し、
    前記エントロピー符号化により得られた周波数領域毎の符号量に対して、前記コンポーネント毎に視覚伝達関数の逆数を乗じることで得られる値に基づき、符号量を削減することを特徴とする画像符号化方法。
  9. 前記符号量削減工程は、低圧縮率である場合と高圧縮率である場合とで符号量の削減を変えることを特徴とする請求項7又は8に記載の画像符号化方法。
  10. 前記符号量削減工程は、ある一定の圧縮率までは全域に渡って平均的に符号量を削減し、前記圧縮率以上からは高域から順に符号量を削減することを特徴とする請求項9に記載の画像符号化方法。
  11. 前記符号量削減工程は、所定の圧縮率以下である場合、全域に渡って、前記符号量又は前記視覚特性に基づいた符号量の比と略同じ比率で符号量を削減することを特徴とする請求項9に記載の画像符号化方法。
  12. 前記符号量削減工程は、所定の圧縮率以上である場合、当該圧縮率までは、全域に渡って、前記符号量又は前記視覚特性に基づいた符号量の比と略同じ比率で符号量を削減することを特徴とする請求項9に記載の画像符号化方法。
  13. 請求項7乃至12の何れか1項に記載の画像符号化方法を実行させるようにコンピュータを動作させることを特徴とする画像符号化プログラム。
  14. 請求項13に記載の画像符号化プログラムを記録したコンピュータ読み取り可能な記録媒体。
JP2002024121A 2002-01-31 2002-01-31 画像符号化装置、画像符号化方法、画像符号化プログラム、画像符号化プログラムを記録した記録媒体 Expired - Fee Related JP3771175B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2002024121A JP3771175B2 (ja) 2002-01-31 2002-01-31 画像符号化装置、画像符号化方法、画像符号化プログラム、画像符号化プログラムを記録した記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2002024121A JP3771175B2 (ja) 2002-01-31 2002-01-31 画像符号化装置、画像符号化方法、画像符号化プログラム、画像符号化プログラムを記録した記録媒体

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2006007395A Division JP4067550B2 (ja) 2006-01-16 2006-01-16 画像符号化装置、画像符号化方法、画像符号化プログラム、画像符号化プログラムを記録した記録媒体

Publications (3)

Publication Number Publication Date
JP2003230162A JP2003230162A (ja) 2003-08-15
JP2003230162A5 JP2003230162A5 (ja) 2005-06-23
JP3771175B2 true JP3771175B2 (ja) 2006-04-26

Family

ID=27746651

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002024121A Expired - Fee Related JP3771175B2 (ja) 2002-01-31 2002-01-31 画像符号化装置、画像符号化方法、画像符号化プログラム、画像符号化プログラムを記録した記録媒体

Country Status (1)

Country Link
JP (1) JP3771175B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4680112B2 (ja) 2006-03-30 2011-05-11 三菱電機株式会社 画像符号化装置
US7813564B2 (en) * 2007-03-30 2010-10-12 Eastman Kodak Company Method for controlling the amount of compressed data

Also Published As

Publication number Publication date
JP2003230162A (ja) 2003-08-15

Similar Documents

Publication Publication Date Title
US7321695B2 (en) Encoder rate control
EP0888689B1 (en) Data compression using hybrid lossless entropy encoding of run-length codes
US7016545B1 (en) Reversible embedded wavelet system implementation
US5966465A (en) Compression/decompression using reversible embedded wavelets
US7751633B1 (en) Method for compressing an image
JP4365957B2 (ja) 画像処理方法及びその装置及び記憶媒体
US9025899B2 (en) Region-based image compression
US20010031094A1 (en) Image processing apparatus and method, and storage medium used therewith
CN102165760A (zh) 图像编码装置、数字静态相机、数字摄像机、摄像元件、打印机以及图像编码方法
US7206458B2 (en) Method of compressing digital images acquired in CFA format
Akyazi et al. Learning-based image compression using convolutional autoencoder and wavelet decomposition
JP4017112B2 (ja) 符号化データ生成装置及び方法、プログラム並びに情報記録媒体
US20110091121A1 (en) Coding apparatus and method
KR100317792B1 (ko) 가역임베디드웨이블릿을이용한데이터압축/복원장치및방법
JP3771175B2 (ja) 画像符号化装置、画像符号化方法、画像符号化プログラム、画像符号化プログラムを記録した記録媒体
EP1322116A2 (en) Image compression device, method for image compression, and electronic camera
JP4067550B2 (ja) 画像符号化装置、画像符号化方法、画像符号化プログラム、画像符号化プログラムを記録した記録媒体
US7327893B2 (en) Method for compressing digital images
JP4003628B2 (ja) 画像符号化装置及び方法、並びにプログラム
US20050207659A1 (en) Image-processing apparatus, program, and recording medium
JP4678814B2 (ja) 画像処理方法及び装置
US8311354B2 (en) DCT-based technique with rhombus scanning for image compression
JP3907505B2 (ja) ブロックトランケーション符号化装置及び方法
JP5482177B2 (ja) 符号化装置、プログラム、記録媒体
Tanaka et al. A new combination of 1D and 2D filter banks for effective multiresolution image representation

Legal Events

Date Code Title Description
A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20041006

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20041006

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20050823

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20051024

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20051115

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060116

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20060207

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20060208

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100217

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110217

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120217

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130217

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130217

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140217

Year of fee payment: 8

LAPS Cancellation because of no payment of annual fees