JP2005065230A - 符号化装置、符号化制御方法、プログラム及び記録媒体 - Google Patents

符号化装置、符号化制御方法、プログラム及び記録媒体 Download PDF

Info

Publication number
JP2005065230A
JP2005065230A JP2004173495A JP2004173495A JP2005065230A JP 2005065230 A JP2005065230 A JP 2005065230A JP 2004173495 A JP2004173495 A JP 2004173495A JP 2004173495 A JP2004173495 A JP 2004173495A JP 2005065230 A JP2005065230 A JP 2005065230A
Authority
JP
Japan
Prior art keywords
encoding
quantization
truncation
subband
control means
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2004173495A
Other languages
English (en)
Other versions
JP4219303B2 (ja
Inventor
Hiroyuki Sakuyama
宏幸 作山
Toru Suino
亨 水納
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP2004173495A priority Critical patent/JP4219303B2/ja
Publication of JP2005065230A publication Critical patent/JP2005065230A/ja
Application granted granted Critical
Publication of JP4219303B2 publication Critical patent/JP4219303B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

【課題】インターレース画像のフレームベース符号化した符号を復号し、フィールド分解して表示した場合に、フィールド間の動きがあると、本来の被写体のほかに、その残像が見える不都合が発生しやすい。このような不自然な画質劣化を抑制すると同時に画質の向上を達成する。
【解決手段】符号化制御手段101が、フィールド間の動き量、及び、圧縮率又は量子化誤差に基づき、符号化処理手段100におけるフレームベース符号化処理における量子化又はトランケーションを適切に制御することにより、上記の課題を解決する。
【選択図】図14

Description

本発明は、動画像の符号化に係り、特に、インターレース画像のフレームベース符号化に関する。
ビデオカメラ等の動画撮影機器においては、一般に、1/60秒間隔でインターレース走査により動画を撮影している。このようなビデオカメラ等で撮影された動画データの符号化方法として、個々のインターレース画像(フィールド)をそのまま符号化するフィールドベース符号化と、相前後する2枚のインターレース画像から合成したノンインターレース画像(フレーム)を符号化するフレームベース符号化がある。
各フィールドの画像は走査線が飛び飛びであるので、走査線が連続したフレームの画像に比べ垂直方向の画素相関が弱いため、圧縮効率の面ではフレームベース符号化が一般的に有利である。しかし、フレームベース符号化においては、フレームを構成するフィールド間の動き量が大きい場合に、圧縮効率が低下する問題と、不自然な画質劣化を生じやすいという問題がある。
上記圧縮効率の低下の問題を解決するために、フレーム符号化とフィールド符号化をブロック単位で適応的に切り替える符号化装置の発明が特許文献1に記載されている。この発明に係る符号化装置においては、相前後する2フィールドのインターレース画像からフレームのノンインターレース画像を合成し、それをブロックに分割し、垂直方向に並んだ2ブロックについて垂直方向の画素相関(1)を調べる。また、この2ブロックをインターレース画像に再変換し、その画像についても同様の画素相関(2)を調べる。そして、画素相関(1)と画素相関(2)の強さを比較し、画素相関(1)の方が強い場合には2ブロックのノンインターレース画像を符号化するが、画素相関(2)の方が強い場合には、2ブロックのインターレース画像を符号化する。各ブロックの符号には、どちらの方法で符号化されたかの識別のための情報が付加される。
次に、上記のもう1つの問題について説明する。図1の(a)は第(n)フィールドのインターレース画像、(b)はその1/60秒後の第(n+1)フィールドのインターレース画像、(c)はこの2フィールドのインターレース画像を合成して得られるフレームのノンインターレース画像の例をそれぞれ示している。2イールド間で被写体が図示のように右方向へ移動した場合、フレーム画像上で被写体の左右エッジ部分が走査線毎に複数画素分だけ櫛形にずれる。(d)は櫛形のエッジ部分を拡大したもので、Lがフィールド間の動き量に相当する。
フレームベース符号化において、上記”櫛形”が、符号化効率を低下させる原因であると同時に、特有の不自然な画質劣化を生じさせる原因である。
この不自然な画質劣化について、図2を参照しさらに説明する。第(n)フィールドでは図2(a)に示す位置にあった縦線が、次の第(n+1)フィールドでは(b)に示す位置に移動した場合、両フィールドから合成されたフレーム上では、その縦線は(c)に示すような2本の点線となる。このフレームをフレームベース符号化した後に復号すると、符号化の際の量子化(後述のトランケーションも含む)の影響により、復号されたフレーム上では、(d)に示すように点線の点と点の間が淡い色でつながった様になる。したがって、復号されたフレームから分解した各フィールドでは(e)及び(f)に示すような2本の点線が表れる。その結果、復号されたフレームをフィールド分解してテレビジョン受像機等でインターレース表示すると、各フィールドに本来の縦線とその”残像”の如き縦線が表れ、本来は1本の縦線であったものが2本の縦線の如く見えてしまう。図2では縦線が移動した例であったが、線でなく面が移動した場合には、面が二重に見えたり、左右にぶれて見えることになる。このような現象を、本明細書では”残像現象”と呼ぶことがある。
なお、2次元ウェーブレット変換を用いるフレームベース符号化に関する発明が特許文献2に記載されている。その概要は、画像のブロック領域毎に画質を制御するために、フレーム間差分によって動き量を検出し、検出した動き量とサブバンドの種類に応じて決定した重み係数を、量子化後のウェーブレット係数に乗じるというものである。
特開2002-64830号公報 特開2001-326936号公報 Wenjun Zeng,Scott Daly and Shawmin Lei,"VISUAL OPTIMIZATION TOOLS IN JPEG 2000",The 2000 International Conference on Image Processing (ICIP-2000) J.Katto and Y.Yasuda,"Performance evaluation of subband coding and optimization of its filter coefficients,"Journal of Visual Communication and Image Representation,vol.2,Dec.1991,pp.303-313 Marcus J.Nadenau and Julien Reichel,"Opponent color,human vision and wavelets for image compression",Proceedings of the Seventh Color Imaging Conference,Scottsdale,Arizona,November 16-19,1999,IS&T,pp.237‐242 Marcus J.Nadenau,Julien Reichel,and Murat Kunt,"Wavelet-based color image compression:Exploiting the contrast sensitivityfunction",IEEE Transactions on Image Processing,2000 D.S.Taubman and M.W.Marcellin,"JPEG 2000:Image Compression Fundamentals,Standards and Practice",Kluwer,2002
よって、本発明の目的は、インターレース画像のフレームベース符号化において、前述のような不自然な画質劣化を抑制すると同時に画質の向上を達成することにある。
なお、本出願人は、本発明と関連する発明を特願2002-289807号、特願2002-300468号、特願2002-300476号、及び、特願2002-360809号により特許出願している。各特許出願に係る発明の概要は次の通りである。
特願2002-289807号:インターレース画像(フィールド)のフレームベース符号化において、フレーム(ノンインターレース)画像の2次元ウェーブレット変換を行う。1LHサブバンド係数にフィールド間の動きによる櫛形の影響が強く表れることに着目し、少なくとも1LHサブバンドの係数値、又は、少なくとも1LHサブバンド係数の符号量に基づいて、フィールド間の動き量(移動速度)を判定する。
特願2002-300468号:インターレース画像のフレームベース符号化において、フレーム画像の2次元ウェーブレット変換を行う。動き量は大きいが動いている物体が小さい場合でも、フィールド間の動き量を的確に判定するため、画像をサブブロック(例えばコードブロック)に分割し、各サブブロックの少なくとも1LHサブバンドの係数値又は符号量に基づいて、画像全体としてのフィールド間の動き量を判定する。
特願2002-300476号:インターレース画像のフレームベース符号化において、フレーム画像の2次元ウェーブレット変換を行う。画像をサブブロックに分割し、各サブブロック単位で、少なくとも1LHサブバンドの係数値又は符号量に基づきフィールド間の動き量を判定する。動画を撮影するカメラが静止していれば、画像内に、動く部分(さらには高速で動く部分と低速で動く部分)と動かない部分があるが、サブブロック毎の判定により、そのような各部分の移動量判定が可能である。
特願2002-360809号:インターレース画像のフレームベース符号化において、フレーム画像の周波数変換(例えばウェーブレット変換)により得られる周波数係数の量子化、量子化後の周波数係数のトランケーション、又は、符号のトランケーションを、フィールド間の動き量に応じて制御することにより、不自然な画質劣化を抑制する。
一般に画像の符号化(圧縮)は、
(A)画像データの周波数領域の係数への変換 → 周波数毎の係数の量子化
→ 量子化後の係数のエントロピー符号化
又は、
(B)画像データの周波数領域の係数への変換 → 周波数毎の係数の量子化
→ 量子化後の係数の、最終的に必要な部分(例;必要なビットプレーン又はサブビットプレーン)だけをエントロピー符号化
又は、
(C)画像データの周波数領域の係数への変換 → 周波数毎の係数の量子化
→ 量子化後の係数のエントロピー符号化 → 最終的に不要なエントロピー符号の破棄(トランケーション)
という処理フローをとることが多い。処理フロー(C)におけるエントロピー符号のトランケーションはポスト量子化とも呼ばれる。処理フロー(B)において、エントロピー符号化の対象とならなかった係数のビットプレーン又はサブビットプレーンは破棄されたことと等価である。すなわち係数状態でのトランケーションが行われるということである。
本発明にあっては、前述の”残像現象”のような不自然な画質劣化を抑制し、かつ、良好な画質を得るために、インターレース画像のフレームベース符号化のフロー(例えば、上記(A)(B)(C)の如きフロー)の中で、フィールド間の動きによる櫛形を残すような最適な量子化、又は、トランケーションの制御を行う。
非特許文献1に記載されているように、量子化やトランケーションの最適な方法は、量子化誤差や圧縮率に依存することが知られている(圧縮率と量子化誤差は異なるものであるが、前記最適な方法に対しては類似の影響を与える)。
一般に、量子化誤差や圧縮率が小さくて画質劣化がわかりにくい場合には、観察距離で決定される特定の視覚感度(後述する周波数に対する人間のコントラスト感度)に基づいた重みを用いた量子化が好ましい。しかし、圧縮率や量子化誤差が大きくなって画質劣化が目立つようになると、好ましい画質を得るためには、前記重みとは異なった重みを用いる必要がある。これは、周波数毎の誤差に対する人間の感度が、誤差量自体の関数になっているからだと考えられる。概ね、誤差量自体が大きいほど低域の周波数係数の量子化を控え、高域の周波数係数をより多く量子化するのが良いとされており、ウェーブレット変換を利用した符号化においては、これを簡単に実験で確かめることができる(前述の様に、量子化誤差と圧縮率は異なるものであるが、通常、誤差量自体が大きい場合は圧縮率も大きくなるため、簡単のために、誤差量を圧縮率で代替することも可能である)。
よって、インターレース画像のフレームベース符号化において、フレームを構成するフィールド間の動き量と、圧縮率又は量子化誤差の両方を反映した量子化やトランケーションを行うことが有効なのである。
以下、本発明の特徴について順次説明する。
請求項1の発明は、インターレース画像のフレームベース符号化処理を行う符号化処理手段と、フレームを構成するフィールド間の動き量を検出し、該動き量、及び、圧縮率又は量子化誤差に基づいて、前記符号化処理手段における周波数係数の量子化を制御する符号化制御手段を有することを特徴とする符号化装置である。
かかる構成によれば、フィールド間の動き量、及び、圧縮率又は量子化誤差に応じた適切な量子化を行い、フィールド間に動きがある場合においても不自然な画質劣化を抑制し、同時に良好な画質を得ることができる。
請求項2の発明は、インターレース画像のフレームベース符号化処理を行う符号化処理手段と、フレームを構成するフィールド間の動き量を検出し、該動き量、及び、圧縮率又は量子化誤差に基づいて、前記符号化処理手段における周波数係数又は符号のトランケーションを制御する符号化制御手段を有することを特徴とする符号化装置である。
かかる構成によれば、フィールド間の動き量、及び、圧縮率又は量子化誤差に応じた適切な周波数係数又は符号のトランケーションを行い、フィールド間に動きがある場合においても不自然な画質劣化を抑制し、同時に良好な画質を得ることができる。
量子化やトランケーションは画質制御のために行われるものであるが、その制御を最も精密に行いたい場合には、量子化やトランケーションを、適用可能な最小単位毎に制御するのが適当である。本明細書においては、この最小単位を画質制御単位という。
画質制御単位は、周波数係数そのもの(例えば、JPEGならばDCT係数、JPEG2000ならばウェーブレット変換係数)、所定サイズの矩形ブロック(例えば、JPEGならばDCT係数、JPEG2000ならばコードブロック)などである。
よって、請求項3の発明は、請求項1の発明の符号化装置において、符号化制御手段が画質制御単位毎に量子化を制御することを特徴とするものである。
画質制御毎の量子化の制御によって、より精密かつ最適な画質制御が可能である。
なお、前記特願2002-300476号に係る発明によれば、このような画質制御単位のフィールド間動き量(櫛形量)の検出が可能である。
また、請求項4の発明は、請求項2の発明の符号化装置において、符号化制御手段が画質制御単位毎にトランケーションを制御することを特徴とするものである。
画質制御単位毎のトランケーションの制御によって、より精密かつ最適な画質制御が可能である。
一方、画質制御を高速・簡易に行いたい場合や実装上の制約がある場合には、量子化又はトランケーションの制御を、画質制御単位よりも大きな単位毎に、例えば、周波数変換係数の周波数帯域毎に行うのが便利である。
よって、請求項5の発明は、請求項1の発明の符号化装置において、符号化制御手段が周波数係数の周波数帯域毎に量子化を制御することを特徴とするものである。
このように量子化の制御の単位を周波数帯域とすれば、量子化の制御が簡易になり、画質制御の高速化が可能である。
この場合、フィールド間の動き量検出は、画像全体について行えばよい。このような検出は、前記特願2002-289807号又は特願2002-300468号に係る発明により行うことができる。
また、請求項6の発明は、請求項2の発明の符号化装置において、符号化制御手段が周波数係数の周波数帯域毎にトランケーションを制御することを特徴とするものである。
このようにトランケーションの制御の単位を周波数帯域とすれば、トランケーションの制御が簡易になり、画質制御の高速化が可能である。
この場合、フィールド間の動き量検出は、画像全体について行えばよい。
近年、符号化において、前記JPEG(Joint Photographic Coding Experts Group)で採用されているDCT(離散コサイン変換)に代わる周波数変換として、ウェーブレット変換(DWT;離散ウェーブレットフレット変換)の採用が増加している。その代表例は、2001年に国際標準になった、JPEG後継の画像圧縮伸長方式JPEG2000である。
DCTの場合には個々のDCT係数が各周波数帯域を有する。ウェーブレット変換の場合には、周波数係数の周波数帯域とは各デコンポジションレベルを意味し、デコンポジションレベルが小さい程周波数が高いことになる。
そして、前述の「櫛形を残すような量子化またはトランケーション」とは、高い周波数帯域の係数の量子化またはトランケーションを控えることを意味する。これは、図2から明らかなように、櫛形は、1画素毎に画素値が大きく変わるために生じ、最も高い周波数をとるからである。
ここで、ウェーブレット変換の手順と、デコンポジションレベル、解像度レベル、サブバンドの定義について説明する。
JPEG2000では、5×3変換と呼ばれるウェーブレット変換と、9×7変換と呼ばれるウェーブレット変換が採用されている。それぞれの順変換式と逆変換式を次に示す。
5×3変換
(順変換)
C(2i+1)=P(2i+1)−floor((P(2i)+P(2i+2))/2) [step1]
C(2i)=P(2i)+floor(((C(2i-1)+C(2i+1)+2)/4)| [step2] (1)
(逆変換)
P(2i)=C(2i)−floor((C(2i-1)+C(2i+1)+2)/4) [step1]
P(2i+1)=C(2i+1)+floor((P(2i)+P(2i+2))/2) [step2] (2)
ただし、floor(x)はxのフロア関数(実数xを、xを越えず、かつ、xに最も近い整数に置換する関数)を示している。
9×7変換
(順変換)
C(2n+1)=P(2n+1)+α*(P(2n)+P(2n+2)) [step1]
C(2n)=P(2n)+β*(C(2n-1)+C(2n+1)) [step2]
C(2n+1)=C(2n+1)+γ*(C(2n)+C(2n+2)) [step3]
C(2n)=C(2n)+δ*(C(2n-1)+C(2n+1)) [step4]
C(2n+1)=K*C(2n+1) [step5]
C(2n)=(1/K)*C(2n) [step6] (3)
(逆変換)
P(2n)=K*C(2n) [step1]
P(2n+1)=(1/K)*C(2n+1) [step2]
P(2n)=X(2n)-δ*(P(2n-1)+P(2n+1)) [step3]
P(2n+1)=P(2n+1)-γ*(P(2n)+P(2n+2)) [step4]
P(2n)=P(2n)-β*(P(2n-1)+P(2n+2)) [step5]
P(2n)=P(2n+1)-α*(P(2n)+P(2n+2)) [step6] (4)
ただし、α=-1.586134342059924
β=-0.052980118572961
γ=0.882911075530934
δ=0.443506852043971
K=1.230174104914001
図3乃至図7により、16×16画素のモノクロの画像に対して、5x3変換と呼ばれるウェーブレット変換を2次元(垂直方向及び水平方向)で施す過程について説明する。
図3のようにXY座標をとり、あるX座標について、Y座標がyである画素の画素値をP(y)(0≦y≦15)と表す。JPEG2000では、まず垂直方向(Y座標方向)に、Y座標が奇数(y=2i+1)の画素を中心にハイパスフィルタを施して係数C(2i+1)を得る。次に、Y座標が偶数(y=2i)の画素を中心にローパスフィルタを施して係数C(2i)を得る(これを全てのX座標について行う)。前記順変換(1)式中のstep1の式がハイパスフィルタを表し、step2の式がローパスフィルタを表す。
なお、画像の端部においては、中心となる画素に対して隣接画素が存在しない場合があり、この場合には所定ルールによって画素値を補うことになるが、本発明とは本質的には関係しないため詳述しない。
簡単のため、ハイパスフィルタで得られる係数をH、ローパスフィルタで得られる係数をL、と表記すれば、前記垂直方向の変換によって図3の画像は図4のようなL係数とH係数の配列へと変換される。
続いて、図3の係数配列に対して、水平方向に、X座標が奇数(x=2i+1)の係数を中心にハイパスフィルタを施し,次にX座標が偶数(x=2i)の係数を中心にローパスフィルタを施す(これを全てのyについて行う。この場合、式(1)中のP(2i)等は係数値を表すものと読み替える)。
簡単のため、前記L係数を中心にローパスフィルタを施して得られる係数をLL、前記L係数を中心にハイパスフィルタを施して得られる係数をHL、前記H係数を中心にローパスフィルタを施して得られる係数をLH、前記H係数を中心にハイパスフィルタを施して得られる係数をHH、と表記すれば、図4の係数配列は、図5の様な係数配列へと変換される。ここで同一の記号を付した係数群はサブバンドと呼ばれ、図5は4つのサブバンドで構成される。
以上で、1回のウェーブレット変換(1回のデコンポジション(分解))が終了し、LL係数だけを集めると(図6の様にサブバンド毎に集め、LLサブバンドだけ取り出すと)、ちょうど原画像の1/2の解像度の“画像”が得られる(このように、サブバンド毎に分類することをデインターリーブと呼び、図5のような状態に配置することをインターリーブするという)。
2回目のウェーブレット変換は、LLサブバンドを原画像と見なして、上記と同様の変換を行えばよい。2回目のウェーブレット変換を行い、係数を並べ替えると、模式的な図7が得られる.
ここで、図6,図7において、係数の接頭の1や2は、何回のウェーブレット変換で該係数が得られたかを示しており、デコンポジションレベルと呼ばれる。ウェーブレット変換においては、このデコンポジションレベルが周波数帯域に相当する。また、デコンポジションレベルとほぼ逆の関係にある解像度レベルの定義を図8に示す。
なお、以上の議論において、1次元のみのウェーブレット変換をしたい場合には、垂直又は水平いずれかの方向だけの処理を行えばよい。
このような5×3ウェーブレット変換の逆変換においては、図5の様なインターリーブされた係数の配列に対して、まず水平方向に、X座標が偶数(x=2i)の係数を中心に逆ローパスフィルタを施し、次に、X座標が奇数(x=2i+1)の係数を中心に逆ハイパスフィルタを施す(これを全てのyについて行う)。前記逆変換式(2)中のstep1の式が逆ローパスフィルタを表し、step2の式が逆ハイパスフィルタを表す。順変換の場合と同様、画像の端部においては中心となる係数に対して隣接係数が存在しないことがあり、この場合は所定ルールによって適宜係数値を補うことになるが、その説明は割愛する。
これにより、図5の係数配列は図4のような係数配列に変換(逆変換)される。続いて、垂直方向に、Y座標が偶数(y=2i)の係数を中心に逆ローパスフィルタを施し、次にY座標が奇数(y=2i+1)の係数を中心に逆ハイパスフィルタを施せば(これを全てのX座標について行う)、1回のウェーブレット逆変換が終了し、図3の画像に戻る(再構成される)ことになる。なお、ウェーブレット変換が複数回施されている場合は、図3をLLサブバンドとみなし、HL等の他の係数を利用して同様の逆変換を繰り返せばよい。
以上説明したように、5×3ウェーブレット変換は、5画素を用いて1つのローパスフィルタの出力(ローパス係数)が得られ、3画素を用いて1つのハイパスフィルタの出力(ハイパス係数)が得られる変換である。これに対し、9×7ウェーブレット変換は、9画素を用いて1つのローパスフィルタの出力(ローパス係数)が得られ、7画素を用いて1つのハイパスフィルタの出力(ハイパス係数)が得られる変換である。このように、5×3変換と9×7変換の主な違いは、フィルタの範囲の違いであり、偶数位置中心にローパスフィルタが、奇数位置中心にハイパスフィルタが施されるのは同様である。したがって、図4乃至図7は、9×7変換にも同様に当てはまる。
よって、請求項7の発明は、請求項1の発明の符号化装置において、符号化制御手段がウェーブレット変換のデコンポジションレベル毎に量子化を制御することを特徴とするものである。
このように量子化の制御をデコンポジションレベル毎に行えば、ウェーブレット変換を用いる場合の量子化制御が簡易になり、画質制御の高速化が可能である。
また、請求項8に係る発明は、請求項2の発明の符号化装置において、符号化制御手段がウェーブレット変換のデコンポジションレベル毎にトランケーションを制御することを特徴とするものである。
このようにトランケーションの制御をデコンポジションレベル毎に行えば、ウェーブレット変換を用いる場合のトランケーション制御が簡易になり、高速の画質制御が可能である。
さて、フィールド間の動きにより生じる”櫛形”は、1画素ごとに垂直方向に画素値が大きく変わるが、水平方向には画素値が大きく変わるとは限らない(櫛の端部でしか画素値は変わらない)ものである。すなわち、”櫛形”は、垂直方向の高周波成分である。図1(d)を参照すれば、動き量が大きいと”櫛形”の横エッジの長さが増加するのに対し、縦エッジは略一定である。横エッジ成分は垂直方向の高周波成分であるから、動き量が大きくなるほど(櫛形が顕著になるほど)縦方向の高周波数成分が増加するわけである。
したがって、”櫛形”が生じた場合、ウェーブレット変換係数の中で、1LH係数(デコンポジションレベル1、垂直方向高周波、水平方向低周波の係数)が最も大きな値をとり、1HH係数(デコンポジションレベル1,垂直方向高周波,水平方向高周波の係数)が次に大きな値をとり、1HL係数(デコンポジションレベル1,垂直方向低周波,水平方向高周波の係数)が最も小さな値をとる。このように、同じ周波数帯域(デコンポジションレベル)でもサブバンド毎に”櫛形”の反映の度合いが異なるのである。
よって、請求項9の発明は、請求項1の発明の符号化装置において、符号化制御手段がウェーブレット変換のサブバンド毎に量子化を制御することを特徴とするものである。
サブバンド毎に量子化を制御するということは、周波数帯域及び方向の両方を加味して量子化を制御するということであるため、量子化の簡易な制御によって高精度かつ高速の画質制御が可能である。
また、請求項10の発明は、請求項2の発明の符号化装置において、符号化制御手段がウェーブレット変換のサブバンド毎にトランケーションを制御することを特徴とするものである。
このようなサブバンド毎にトランケーションを制御するということは、周波数帯域及び方向の両方を加味してトランケーションを制御するということであるため、トランケーションの簡易な制御によって高精度かつ高速の画質制御が可能である。
また、請求項11の発明は、請求項9の発明の符号化装置において、符号化制御手段が同一解像度レベル中のサブバンドに関し、LHサブバンドの量子化を最も控えるように制御することを特徴とするものである。
LHサブバンドは垂直方向の高周波成分であり、その損失が大きいと、図2で説明したような”残像”が生じやすい。したがって、LHサブバンドの量子化を最も控えることにより、垂直方向の高周波成分が優先的に保存されるため、不自然な画質劣化である”残像現象”が効果的に抑制される。
また、請求項12に係る発明は、請求項10の発明の符号化装置において、符号化制御手段が同一解像度レベル中のサブバンドに関し、LHサブバンドのトランケーションを最も控えるように制御することを特徴とするものである。
LHサブバンドのトランケーションを最も控えるということは、LHサブバンドの量子化を最も控えることと等価であるから、不自然な画質劣化である”残像現象”が効果的に抑制される。
以上の説明から理解されるように、”櫛形”の影響はデコンポジションレベル1に最も大きく現れ、デコンポジションレベルが上がるにつれてその影響は小さくなる。本出願人の実験によれば、デコンポジションレベル2までの量子化又はトランケーションを適切に制御すれば、十分な効果が得られることが確認された。
よって、請求項13の発明は、請求項7,9又は11の発明の符号化装置において、符号化制御手段が、デコンポジションレベル1及びデコンポジションレベル2のみに関し、量子化を制御することを特徴とするものである。
また、請求項14の発明は、請求項8,10又は12の発明の符号化装置において、符号化制御手段は、デコンポジションレベル1及びデコンポジションレベル2のみに関し、トランケーションを制御することを特徴とするものである。
このように、量子化又はトランケーションの制御の対象をデコンポジションレベル2以下に制限することにより、その制御が簡易、高速になり、かつ、その十分な効果を得ることができる。
ここで、JPEG2000における量子化、トランケーション及び画質制御についてさらに説明する。JPEG2000の符号化処理は概ね図9に示すような流れに従って行われる。また、図10は、画像、タイル、サブバンド、プリシンクト、コードブロックの関係を示す模式図である。
タイルとは、画像を矩形に分割したものであり、分割数=1のときは画像とタイルは同一のものとなる。個々のタイルを独立した1つの画像と見なし、ウェーブレット変換がなされ、サブバンドが生成される。JPEG2000の基本仕様では、ウェーブレット変換として9×7変換を用いる場合には、同一のサブバンドに含まれる係数を同一の数で除算し、線形に量子化することができる。したがって、線形量子化による画質制御はサブバンド単位で可能である(すなわち、線形量子化による画質制御単位はサブバンドである)。
プリシンクトとは、サブバンドを(ユーザが指定可能なサイズの)矩形に分割したもので、画像中の大まかな場所(position)を表すものである。HL,LH,HHの各サブバンドを分割したプリシンクトについては、各サブバンドの対応位置のプリシンクト(合計3個)がひとまとまりとして扱われる。ただし、LLサブバンドを分割したプリシンクトは、1つでひとまとまりとして扱われる。プリシンクトはサブバンドと同じサイズにすることもできる。プリシンクトを(ユーザが指定可能なサイズの)矩形に分割したものが、コードブロックである。図10には、デコンポジションレベル3の場合のタイル、サブバンド、プリシンクト、コードブロックの関係が示されている。
量子化後のサブバンドの係数は、コードブロック単位でビットプレーン符号化される(1つのビットプレーンは3つのサブビットプレーンに分解されて符号化される)。プリシンクトに含まれる全てのコードブロックから、符号の一部を取り出して集めたもの(例えば、全てのコードブロックのMSBから3枚目までのビットプレーンの符号を集めたもの)がパケットである。上記“一部”は“空”(から)でもいいので、パケットの中身が符号的には“空”(から)ということもある。
全てのプリシンクト(=全てのコードブロック=全てのサブバンド)のパケットを集めると、画像全域の符号の一部(例えば、画像全域のウェーブレット係数の、MSBから3枚目までのビットプレーンの符号)ができるが、これをレイヤーと呼ぶ。レイヤーは、大まかには画像全体のビットプレーンの符号の一部であるから、復号されるレイヤー数が増えれば画質は上がる。したがって、レイヤーは画質の単位である。すべてのレイヤーを集めると、画像全域の全てのビットプレーンの符号になる。
ウェーブレット変換の階層数(デコンポジションレベル)=2、プリシンクトサイズ=サブバンドサイズ、としたときのレイヤー構成の例を図11に示す。また、その各レイヤに含まれるパケットの例を、図12に太線で囲んで示す。
この例の場合、プリシンクトサイズ=サブバンドサイズであり、また、プリンシンクトの大きさと同じ大きさのコードブロックを採用しているため、デコンポジションレベル2のサブバンドは4つのコードブロックに、デコンポジションレベル1のサブバンドは9個のコードブロックに分割されている。パケットはプリシンクトを単位とするものであるから、プリシンクト=サブバンドとした場合、パケットはHL〜HHサブバンドを跨いだものとなる。
ここで、パケットは「コードブロックの符号の一部を取り出して集めたもの」であり、不要な符号はパケットとして生成する必要はない。例えば、図11のレイヤー9に含まれる様な下位ビットプレーンの符号は破棄(トランケート)されるのが通常である。
したがって、トランケーションによる画質制御は、コードブロック単位(かつサブビットプレーン単位)で可能である。つまり、トランケーションによる画質制御単位はコードブロックである。なお、パケットの並びをプログレッション順序と呼ぶ。
さて、サブバンド単位での線形量子化を行う場合、主観画質をよくするためには、量子化ステップ数(線形量子化時の除算の分母)は、
量子化ステップ数
=PSNRを最大にするための正規化で決まる数/視覚重み(通称Visual Weight)
(ア)
とするのが通常である。各係数が逆周波数変換(JPEG2000なら逆ウェーブレット変換)されてRGB値にもどされる場合、各係数に生じた量子化誤差が最終的なRGB値へ与える影響は周波数帯域毎(ウェーブレット変換ならサブバンド毎)に異なり、その比は逆周波数変換(JPEG2000なら逆ウェーブレット変換)時の定数(いわゆるサブバンドゲイン)で決まる。
PSNRをよくするためには、該影響をサブバンド間で均一にする必要があり、その均一化のためにサブバンド毎にサブバンドゲインをキャンセルするような量子化が行われる。その詳細は非特許文献2に記載されている。要するに、ある圧縮率において、逆変換後の信号(=複数の信号値で構成される)に生じた誤差の二乗平均を最小にする(=PSNRを最大にする)ためには、各サブバンドをサブバンドゲインの平方根の逆数(の定数倍の値)で線形量子化するのが一般的である。本明細書において、この「PSNRを最大にするための正規化で決まる数」を「基本量子化ステップ数」と呼ぶ。
ただし、PSNRは主観画質とは一致しないため、前記式(ア)の様に、基本量子化ステップ数をさらに視覚的な重み(visual Weight)で除算したものを量子化ステップ数とするのが一般的である。
図13に、非特許文献3に記載の視覚感度の測定例を示す。横軸は縞の周波数(cycle/degree)であり、縦軸は、その周波数で人間が関知する最小のコントラストの逆数、すなわちコントラストに対する感度(相対値)である。輝度Y,色差Cb,色差Crの各々の縞について測定されたコントラストに対する感度が、図13に示されている。図13から、人間の視覚が低い空間周波数でコントラストの変化に対し敏感で、高域で鈍感であること、Yコンポ−ネントに対して最も敏感で、Cbコンポ−ネントに対して最も鈍感であることが分かる。
JPEG2000の標準書に、この視覚感度に基づき、後述する重みが例示されている。各サブバンドの重みは、当該サブバンドが占める周波数帯域における前記視覚感度曲線の積分値として求められ、その詳細は非特許文献4に記載されている。低域のサブバンドでは大きな重み、高域のサブバンドでは小さな重みが与えられる。かかる視覚重みは、本来、視覚感度から求められるものを用いるべきものであるが、その値を意識的に操作して所望の画質を得ることも可能である。例えば、視覚感度上は、1LHの重み=1HLの重み、であるが、
1LHの重み>1HLの重み、
とすることによって、1LHの量子化を1HLの量子化よりも控えることが可能となる。
よって、請求項15の発明は、請求項1,3,5,7,9,11又は13の発明の符号化装置において、符号化制御手段が量子化の制御においてサブバンド毎の視覚重みを変えることを特徴とするものである。
このように量子化の制御においてサブバンド毎の視覚重みを変えることにって、より高精度の画質制御が可能である。
トランケーションに関しても同様に、符号の重要度として、前記視覚重みを加味することができる。一般に、符号の価値は、「その符号を破棄した場合の量子化誤差の増分/その符号量」で評価され、この値が小さい符号(その破棄による符号量の減少に比べて、誤差の増加が少ない符号)から順に破棄される。そして、主観画質をよくするためには、符号の価値を
「その符号を破棄した場合の量子化誤差の増分×視覚重み/その符号量」
で評価するのが通常である。
よって、請求項16の発明は、請求項2,4,6,8,10,12又は14の発明の符号化装置において、符号化制御手段はトランケーションの制御においてサブバンド毎の視覚重みを変えることを特徴とするものである。
このようにトランケーションの制御においてサブバンド毎の視覚重みを変えることによって、より高精度の画質制御が可能である。
さて、以上に述べた「重み」はサブバンドを単位とするものであるが、この重みに、サブバンドを分割したサブブロック(JPEG2000ではコードブロック)の特性を乗じることもよく行われている。人間の視覚は、周波数と同時にコントラスト強度自体の関数でもあり、同じ周波数帯域であっても、コントラストが高いほど、コントラストの誤差(変化)に鈍感なのである。これは、コントラストの誤差を人間が感じるか感じないの閾値が、誤差の絶対値ではなく、誤差の相対的な大きさ(誤差の値/原値という比率)に依存することによる(所謂Weberの法則である)。このように、原値(オリジナルの値)が大きい場合に誤差が目立たなくなる効果を一般に「マスキング」という。
ここで、周波数変換した係数は、一般に原画像のコントラストを反映したものとなるため、係数値の大小をコントラストの大小と見なし得る。そこで、サブブロックに含まれる係数の値が大きいか小さいかを示す指標を、本明細書では”マスキング指標”と呼ぶものとすると、符号の重要度を、
「その符号を破棄した場合の量子化誤差の増分×視覚重み/(マスキング指標×その符号量)」
により評価することが可能である。
よって、請求項17に係る発明は、請求項2,4,6,8,10,12又は14の発明の符号化装置において、符号化制御手段がトランケーションの制御において画質制御単位毎のマスキングを反映させることを特徴とするものである。
このようにトランケーションの制御において、画質制御単位後のマスキングを反映させることによって、より高精度の画質制御が可能である。
さて同様に、サブバンド単位で「重み」変えるのではなく、あるいはサブバンド単位で重み変えると同時に、各サブバンドを分割したサブブロック毎に櫛形の多寡を求め、各サブブロックに適用する重みを、該サブブロックでの櫛形の多寡によってモディファイすることもできる。重みは、本来、視覚の周波数特性より導出されたものであるから同一サブバンド(=同一周波数帯域)内では同じ値であるところ、上記モディファイによって、いわば、サブブロック毎に重みを変えるわけである。前述した通り、サブブロック(JPEG2000ならコードブロック)毎に櫛形の多寡を検出できるので、例えば、櫛形の多寡をサブバンド毎の重みに乗じれば、各サブブロック毎に異なる重みを適用可能である。
よって、請求項18の発明は、請求項2,4,6,8,10,12,14又は16の発明の符号化装置において、符号化制御手段がトランケーションの制御において画質制御単位毎に視覚重みを変更することを特徴とするものである。
また、請求項19の発明は、インターレース画像のフレームベース符号化を制御する符号化制御方法であって、請求項1,3,5,7,9,11,13又は15の発明における符号化制御手段による動き量検出及び量子化制御のためのステップを含むことを特徴とする符号化制御方法である。
また、請求項20の発明は、インターレース画像のフレームベース符号化を制御する符号化制御方法であって、請求項2,4,6,8,10,12,14,16,17又は18の発明における符号化制御手段による動き量検出及びトランケーション制御のためのステップを含むことを特徴とする符号化制御方法である。
請求項21の発明は、請求項19又は20の発明における動き量検出、及び、量子化制御又はトランケーション制御のためのステップをコンピュータに実行させるプログラムである。
また、請求項22の発明は、請求項21の発明のプログラムが記録された、コンピュータが読み取り可能な記録媒体である。
以上の説明から理解されるように、
(1)請求項1乃至19の発明によれば、フィールド間の動きによる不自然な画質劣化の抑制と画質の向上を同時に達成可能である。
(2)請求項3、4の発明によれば、画質制御単位毎の量子化又はトランケーションの制御によって、より精密な画質制御が可能になる。
(3)請求項5乃至10の発明によれば、量子化又はトランケーションの制御が簡易であるため、より高速の画質制御が可能である。
(4)請求項11,12の発明によれば、垂直方向の高周波を保存することにより、垂直方向の高周波成分が優先的に保存されるため、フィールド間の動きにより不自然な画質劣化を効果的に抑制することができる。
(5)請求項13,14の発明によれば、量子化又はトランケーションの制御が簡易になり、より高速な画質制御が可能になる。請求項15乃至18の発明によれば、より高精度な画質制御が可能である。
(6)請求項21,22の発明によれば、インターレース画像のベース符号化における不自然な画質劣化の抑制と画質向上とを同時に達成するための符号化制御を、コンピュータを利用して容易に実施することができる。
等々の効果を得られる。
本発明の実施の形態に係る符号化装置の構成を図14に示す。ここに示す符号化装置は、インターレース画像のフレームベース符号化を行うものであるが、ここでは相前後する2フィールド(インターレース画像)から合成されたフレーム(ノンインターレース画像)が入力されるものとする。ただし、フィールドからフレームを合成する手段を符号化装置の内部に備える形態を排除するものではない。この符号化装置は、フレームベース符号化処理を行う符号化処理手段100と、フレームを構成する2フィールド間の動き量を検出し、その動き量と、所望の圧縮率又は量子化誤差とに基づいて、符号化処理手段100における周波数係数の量子化を制御し、あるいは、符号化処理手段100における周波数係数又は符号のトランケーションを制御する符号化制御手段101とから構成される。
ここでは、符号化処理手段100において、JPEG2000のアルゴリズムにより符号化処理が行われるものとする(ただし、JPEG2000のみに限定されるものではない)。また、ウェーブレット変換として9×7変換が用いられるものとする。また、フレーム画像はRGBの3コンポーネントからなるものとする。動き量の検出と、量子化又はトランケーションの制御の具体的内容については、後記実施例に関連して説明する。
このような符号化装置における移動量検出と量子化又はトランケーションの制御の内容は、本発明の符号化制御方法の内容でもある。したがって、本発明の符号化装置に関する説明は、本発明の符号化制御方法の説明でもある。
図14に示すような符号化装置は、その全体、あるいは、符号化制御手段101の機能を、パソコンやマイクロコンピュータなどのコンピュータを利用し、プログラムにより実現することも可能である。換言すれば、本発明の符号化制御方法の手順は、コンピュータ上でプログラムにより実行し得る。そのようなプログラムと、それが記録されたコンピュータが読み取り可能な磁気ディスク、光ディスク、光磁気ディスク、半導体記憶素子などの各種の記録(記憶)媒体も本発明に包含される。
コンピュータを利用して本発明を実施する形態について、図15を参照し簡単に説明する。図15において、110は中央演算処理装置(CPU)、111はデータやプログラム等を一時的に記憶するためのメモリ、112は補助記憶としてのハードディスク装置、113はシステムバスである。符号化の対象となる動画のデータは、フィールドからフレームが構成された形でハードディスク装置112に格納されているものとする。
処理の流れの概略は以下の通りである。まず、CPU110からの命令により、ハードディスク装置112から動画の1つのフレームがメモリ111に読み込まれる(1)。CPU110は、メモリ111上のフレームを読み込み、JPEG2000の符号化処理を実行するが、その際に、フィールド間の動き量(櫛形量)の検出、量子化又はトランケーションの制御を行う(2)。CPU110は、符号化データをメモリ111上の別の領域に書き込む(3)。1フレーム分の処理が終わると、CPU110からの命令によって、符号化データがハードディスク装置112に記録される(4)。以上の(1)〜(4)の処理が動画のフレーム数だけ繰り返される。
実施例の説明に先立って、JPEG2000について説明を補充する。
前述のように、JPEG2000の圧縮・伸張の処理の基本的な流れは図9に示す通りである。RGB3コンポ−ネントで構成されるカラー画像の圧縮時には、DCレベルシフトと輝度・色差コンポ−ネントへのコンポ−ネント変換(色変換)の後に、ウェーブレット変換がなされる。ウェーブレット係数は、必要に応じて量子化された後、ビットプレーンを単位としたエントロピー符号化がなされる(正確には、ビットプレーンは3つのサブビットプレーンに細分化されて符号化される)。
伸長時には、ビットプレーン単位でのエントロピー復号により復元されたウェーブレット係数は、必要に応じて逆量子化される。得られたコンポ−ネント毎のウェーブレット係数に対し、逆ウェーブレット変換が施され、得られた各コンポーネントの画素値に逆コンポーネント変換がなされることにより、RGBの画素値に戻される。
JPEG2000のDCレベルシフトの変換式は次の通りである。
I(x,y) ← I(x,y)−2Ssiz(i) 順変換
I(x,y) ← I(x,y)+2Ssiz(i) 逆変換 (5)
ただし、Ssiz(i)は原画像の各コンポーネントi(RGB画像ならi0,1,2)のビット深さである。
このDCレベルシフトは、RGB信号値のような正の数である場合に、順変換では各信号値から信号のダイナミックレンジの半分を減算するレベルシフトを、逆変換では各信号値に信号のダイナミックレンジの半分を加算するレベルシフトを行うものである。ただし、このレベルシフトはYCbCr信号のCb,Cr信号のような符号付き整数には適用されない。
JPEG2000では、コンポ−ネント変換として、可逆変換(RCT;Reversible multiple component transformation)と非可逆変換(ICT;Irreversible multiple component transformation)が定義されている。
RCTの順変換と逆変換は次式で表される。
順変換
Y(x,y)=floor((I(x,y)+2*(I(x,y)+I(x,y))/4)
Y(x,y)=I(x,y)-I(x,y)
Y(x,y)=I(x,y)-I(x,y)
逆変換
I(x,y)=Y(x,y)-floor((Y(x,y)+Y(x,y))/4)
I(x,y)=Y(x,y)+I(x,y)
I(x,y)=Y(x,y)+I(x,y) (6)
式中のIは原信号、Yは変換後の信号を示す。RGB信号ならば、I信号において0=R,1=G,2=B、Y信号において0=Y,1=Cb,2=Crと表される。
ICTの順変換と逆変換は次式で表される。
順変換
Y(x,y)=0.299*I(x,y)+0.587*I(x,y)+0.144*I(x,y)
Y(x,y)=-0.16875*I(x,y)-0.33126*I(x,y)+0.5*I(x,y)
Y(x,y)=0.5*I(x,y)-0.41869*I(x,y)-0.08131*I(x,y)
逆変換
I(x,y)=Y(x,y)+1.402*Y(x,y)
I(x,y)=Y(x,y)-0.34413*Y(x,y)-0.71414*Y(x,y)
I(x,y)=Y(x,y)+1.772*Y(x,y) (7)
式中のIは原信号、Yは変換後の信号を示す。RGB信号ならば、I信号において0=R,1=G,2=B、Y信号において0=Y,1=Cb,2=Crと表される。
前述のように、JPEG2000で9×7ウェーブレット変換を選択した場合には、各サブバンド毎に、ウェーブレット係数を線形(スカラー)量子化することができる。同一のサブバンド内では共通の量子化ステップ数が用いられる。量子化式を(8)式に、量子化ステップ数(Δb)を(9)式にそれぞれ示す。
q(u,v)=sign(a(u,v))*floor(|a(u,v)|/Δb) (8)
ただし、 a(u,v)はサブバンドbにおける係数
q(u,v)はサブバンドbにおける係数
Δbはサブバンドbにおける量子化ステップ
Δb=2Rb−εb*floor(1+μb/211) (9)
ただし、 Rbはサブバンドbにおけるダイナミックレンジ
εbはサブバンドbにおける量子化の指数
μbはサブバンドbにおける量子化の仮数
指数εbと仮数μbは、各デコンポジションレベルにおけるすべてのサブバンドを規定する方式と、最下位のデコンポジションレベルにおけるLLサブバンドのみ規定し、残りのサブバンドは予め定められている式を用いて規定する方式の2種類がある。前者を明示的な量子化(expounded quantizationもしくはexplicit quantization)、後者を暗黙的な量子化(derived quantizationもしくはimplicit quantization)と呼ぶ。暗黙的な量子化の指数と仮数の組(εb,μb)は(10)式で決定される。
)=(ε-N+nb,μ) (10)
ただし、nはデコンポジションレベル数
逆量子化式を(11)式に示す。
Rq(u,v)=(q(u,v)+r*2Mb−Nb(u,v))*Δb q(u,v)>0のとき
=(q(u,v)-r*2Mb−Nb(u,v))*Δb q(u,v)<0のとき
= 0 q(u,v)=0のとき (11)
なお、5×3ウェーブレット変換が用いられる場合、量子化ステップ(Δb)は常に1である。これは量子化しないことを意味する。
JPEG2000においては、ウェーブレット係数を符号化後に不要な下位ビットプレーンの符号を破棄することにより実質的な量子化(ポスト量子化)が可能である。さらに、不要な下位ビットプレーンを初めから符号化しない(つまり、係数状態で破棄する)ことによっても、同様の効果を得ることができる。本明細書中では、このような符号化の前の破棄と符号化の後の破棄のいずれもトランケーションと総称する。
この実施例は、ウェーブレット変換係数の線形量子化を、動き量(櫛形量)と、圧縮率又は量子化誤差とに基づいて制御するもので、その処理フローを図16に示す。図16中のステップS100,S101,S104,S105は図14の符号化処理手段100の処理ステップである。ステップS102は図14の符号化制御手段101の処理ステップである。ステップS103は、符号化処理手段100と符号化制御手段101の両方に関わる処理ステップである。すなわち、線形量子化そのものは符号化処理手段100で実行されるものであるが、動き量の検出と線形量子化の制御は制御手段101により実行されるものである。図16中のステップS103のより詳細な処理フローを図17に示す。処理ステップの内容について順に説明する。
《ステップS100》
各フレームに対し、前述のDCレベルシフトとコンポーネント変換が実行される。したがって、この処理ステップ後のフレームは輝度Y、色差Cb,Crの3コンポーネントからなる。
《ステップS101》
フレームの各コンポーネントに2次元のウェーブレット変換が適用される。ここでは、前述したように9×7ウェーブレット変換である。また、ここではデコンポジションレベル4までの変換が行われるものとするが、これに限られるものではない。
《ステップS102》
フィールド間の動き量(櫛形量)が検出される。ここでは、本出願人の先願である特願2002-289807号に係る発明と同様に、1LHサブバンド係数に着目して画像全体についてのフィールド間の動き量(櫛形量)を検出するが、原画像にもともと櫛形以外の垂直方向の高周波が多く含まれる場合にも的確な検出を可能にするため、次のような方法が用いられる。
すなわち,輝度コンポーネントのウェーブレット係数に関し、1LHサブバンドの係数の絶対値の平均値(1LHmean)、1HLサブバンドの係数の絶対値の平均値(1HLmean)、2LHサブバンドの係数の絶対値の平均値(2LHmean)、2HLサブバンドの係数の絶対値の平均値(2HLmean)を求め、動き量(櫛形量)の評価値として
(1Lhmean/1HLmean)/(2Lhmean/2HLmean)
なる「係数比」を算出する。
前述の通り、1Lhmean/1HLmeanの大きさは櫛形の多寡を反映する。しかし、原画像にもともと櫛形以外の垂直方向の高周波が多く含まれる場合にも、この比が大きくなってしまう。一方、デコンポジションレベル2では、櫛形がウェーブレット係数に与える影響は小さくなり、原画像に含まれる櫛形以外の高周波の影響の方が顕著となる。よって、原画像に含まれる櫛形以外の高周波の,垂直・水平方向の割合(2Lhmean/2HLmean)で、1Lhmean/1HLmeanを正規化するならば、櫛形量を正確に検出することが可能である。
なお、ウェーブレット係数の絶対値の平均値の大小は、概ねエントロピー符号化後の符号量の大小に反映されるので、特願2002-289807号に係る発明と同様に必要なサブバンドの係数についてエントロピー符号化を行い、その符号量を用いることもできる。
すなわち、輝度コンポーネントの1LH,1HL,2LH,2HLサブバンドについてエントロピー符号化を行い、それぞれの符号量1Lhcode,1Hlcode,2Lhcode,2HLcodeを求め、
(1Lhcode/1HLcode)/(2Lhcode/2HLcode)
なる「符号量比」を動き量(櫛形量)の評価値として算出することもできる。このような符号量比を算出する態様も本実施例に包含される。
そして、本実施例においては、前記係数比(又は符号量比)と所定の閾値A,B(ただしA<B、係数比の場合と符号量比の場合とでA,Bの値は異なる)との比較判定により、動き量は「小」(A未満)、「中」(A以上、B未満)、「大」(B以上)の3段階に評価される。ただし、この評価は、ステップS103で行うことも可能であり、かかる態様も本実施例に包含される。
《ステップS103》
このステップの処理の全体については図17を参照して後述することとし、ここでは、各コンポーネントの各サブバンドに対する量子化ステップ数の決定方法について説明する。この決定のプロセスは図14中の符号化制御手段101に関わるものである。
所望の圧縮率(又は符号化時に見積もられる量子化誤差)と、所定の閾値X,Y(ただし、X<Y、圧縮率の場合と量子化誤差の場合とではX,Yの値は異なる)との比較により、圧縮率(又は量子化誤差)を「低」(X未満)、「中」(X以上、Y未満)、「高」(Y以上)の3段階に評価する。
より簡単には、「(相対的な)圧縮率低、圧縮率中、圧縮率高」の3つの選択肢の中から1つをユーザに指定させてもよい。かかる態様も本実施例に包含される。
そして、動き量の評価と、圧縮率(又は量子化誤差)の評価とから、図18に示した9通りの視覚重み1〜9の1つを決定する。ただし、本実施例においては、9種類の視覚重みではなく、図19に示した5通りの視覚重みA〜Eを使い分けるものとする。
図20に、視覚重みA〜Eの具体的数値例を図19に対応させた配置で示す。この例では、
視覚重みA<視覚重みB<視覚重みC
の順で、低域のデコンポジションレベル及びサブバンドに対する重みを大きくし、圧縮率の高さ(又は量子化誤差の大ささ)に対応して好ましい画質が得られるようにしている。また、
視覚重みA<視覚重みD<視覚重みE
の順で、高域のデコンポジションレベル及びサブバンドに対する重みを大きくし、動き量の大きい画像ほど櫛形の量子化(又はトランケーション)が控えられるようにしている。
図21に、視覚重みA〜Eの別の数値例を図19に対応させた配置で示す。ここに示す視覚重みを適用すれば、圧縮率の高さ(又は量子化誤差の大ささ)に対応して好ましい画質が得られると同時に、デコンポジションレベル2までのLHサブバンド係数が優遇され、櫛形の量子化(又はトランケーション)が控えられるようになっている。
上のようにして決定された視覚重みを用いて、各コンポーネントの各デコンポジションレベルの各サブバンドの量子化に適用される量子化ステップ数を次式により求める。
量子化ステップ数(線形量子化時の除算の分母)
=定数×基本量子化ステップ数/視覚重み (12)
ここで、基本量子化ステップ数として図22に示す値を使用する。なお、量子化がダイナミックレンジの削減を意図していない場合は、量子化ステップ数が1より小さいことも珍しくない。
このような圧縮率(又は量子化誤差)及び動き量を反映した視覚重み、を反映した量子化ステップ数を用いることにより、量子化誤差と櫛形の多寡を反映した量子化が可能となる。
前記(12)式中の「定数」は、積極的にダイナミックレンジを削減するためのもので、その大きさによって圧縮率や量子化誤差の量が制御されることになる。この定数の値は適宜指定されるべきものであり、もちろん1とすることもできる。
図20に示した視覚重みの値を用いて算出された量子化ステップ数の値を、図19に対応させた形で図23に示す。また、図21に示した視覚重みの値を用いて算出された量子化ステップ数の値を図19に対応させた形で図24に示す。
なお、線形量子化の場合、通常な数学的量子化誤差は「量子化ステップ数の1/2×サブバンドゲインの平方根」の、全ての係数についての総和となるため、ユーザにより選択された、又は見積もられた量子化誤差の大小は、量子化ステップ数の大小として反映させることができる(誤差量の指標として視覚的な量子化誤差を用いる場合は、前記「量子化ステップ数の1/2×サブバンドゲインの平方根」に、そのサブバンドで適用する視覚重みを乗じて、全ての係数について総和をとればよい。ただし、前述のように、視覚重み自体が誤差の関数であるため、視覚重み自体は適宜選択する必要がある)。
次に、ステップS103の処理全体について、図17を参照し説明する。
まず、動き量と、圧縮率(又は量子化誤差)とに基づいて、前述のようにして図20又は図21に示す視覚重みを選択する(ステップS110)。
1つのコンポーネントを選択し(ステップS111)、選択されたコンポーネントの1つのデコンポジションレベルを選択し(ステップS113)、そして、選択されたコンポーネントの選択されたデコンポジションレベルのサブバンドを1つ選択する(ステップS115)。そして、当該サブバンドに適用される量子化ステップ数を決定し(ステップS117)、当該サブバンドの全ての係数を線形量子化する(ステップS118)。
ステップS115に戻り、別の1つのサブバンドを選択し、それに対する量子化ステップ数を決定して当該サブバンドの全係数を線形量子化する(ステップS117,S118)。
選択されたコンポーネント及びデコンポジションレベルの全てのサブバンドに対する線形量子化が終わると(ステップS116,Yes)、ステップS113に戻り、別の1つのデコンポジションレベルを選択し、そのデコンポジションレベルの全てのサブバンドに対する線形量子化のための処理を繰り返す(ステップS113〜S118)。
選択されたコンポーネントの全てのデコンポジションレベルの全てのサブバンドに対する線形量子化を終了すると(ステップS114,Yes)、ステップS111に戻り、別の1つのコンポーネントを選択し、そのコンポーネントの全てのデコンポジションレベルの全てのサブバンドの線形量子化のための処理を繰り返す(ステップS113〜S118)。
全てのコンポーネントについて線形量子化が終了すると(ステップS112,Yes)、図16のステップS103を終了する。
図16のフローに戻って説明する。
《ステップS104》
線形量子化されたウェーブレット係数に対し、サブバンド毎にエントロピー符号化が行われる。JPEG2000においては、サブバンド毎に、係数が上位ビット(MSB)から下位ビット(LSB)まで、ビットプレーン単位で符号化される。
簡単のために、デコンポジションレベル=2として一般的な説明を行う。図7の2LLサブバンドの係数が図25のような値をとったとする。これらの値を2進数で表現し、各ビット毎に分けたものがビットプレーンであり、図25の係数は図26のような4枚のビットプレーンに分けることができる。10進数の15の2進表現は”1111”であるから、図25の値15の係数に対応する位置では全てのビットプレーンに”1”が立つことになる。
そして、JPEG2000では、これらのビットプレーンを個々にエントロピー符号化する。より詳細には、各ビットプレーンを3つのサブビットプレーンに分割して、各サブビットプレーンごとにエントロピー符号化を行う。エントロピー符号化にはMQコーダと呼ばれる算術符号器が使用されるが、その説明は省略する。
《ステップS105》
エントロピー符号からパケットが生成され、それを所定のプログレッション順に並べ、必要なヘッダなどを付加した所定フォーマットの符号が形成される。
デコンポジションレベル=2の場合は、例えば図27のような構成の符号の形成が可能である。この例では、符号が2LLサブバンドから始まって1HHサブバンドで終わることを示している。また、各ビットプレーンは最上位bitから順に符号化されている。
この実施例は、エントロピー符号化段階におけるトランケーション、すなわち、ウェーブレット変換係数の破棄を、動き量(櫛形量)と圧縮率又は量子化誤差とに基づいて制御するるもので、その処理フローを図28に示す。図28中のステップS200,S201,S202,S206,S207は図14の符号化処理手段100の処理ステップである。ステップS203,S204,S205は符号化制御手段101の処理ステップである。各処理ステップの内容について順に説明する。
《ステップS200》
各フレームに対し、前述のDCレベルシフトとコンポーネント変換が実行される。
《ステップS201》
フレームの各コンポーネントに2次元のウェーブレット変換が適用される。ここでは、前述したように9×7ウェーブレット変換である。また、ここではデコンポジションレベル4までの変換が行われるものとする。
《ステップS202》
ウェーブレット係数は、サブバンド毎に、図22に示した基本量子化ステップ数を用いて量子化(正規化)される。
《ステップS203》
前記実施例1におけるステップS102と同様に、フィールド間の動き量(櫛形量)として「係数比」が求められ、この係数比を2つの所定の閾値と比較することにより、動き量が「小」「中」「大」の3段階に評価される。
《ステップS204》
前記実施例1のステップS103に関連して説明したところと同様に、圧縮率(又は量子化誤差)と、動き量とに基づいて図19に示す視覚重みA〜Eの1つを選択する。具体的には、図20又は図21に示した、いずれかの視覚重みの数値を選択する。
《ステップS205》
各サブバンドに関するトランケーション量を次式により算出する。ただし、四捨五入により整数化される。
トランケーション量=log2(定数×1/当該サブバンドの視覚重み) (13)
上式の「定数」は、前述のように量子化誤差が大きいほど大きな値となり(係数を破棄するほど量子化誤差が増大するため)、ここでは、16,32,64の3つの値を使用している。図20の視覚重み値を用いて計算したトランケーション量と、図21の視覚重み値を用いて計算したトランケーション量を、図19に対応させた形で、図29と図30に示す。したがって、このステップでは、実際的には、図29又は図30のテーブルより対応するトランケーション量の数値を選択する。
《ステップS206》
各サブバンド毎に、当該サブバンドに関して決定されたトランケーション量(図29又は図30)に対応した下位サブビットプレーンを除いた、上位ビットプレーンのみがエントロピー符号化される。ここではビットプレーン単位で係数のトランケーションを行うが、サブビットプレーン単位でのトランケーションも可能である。
《ステップS207》
エントロピー符号からパケットが生成され、パケットを所定のプログレッション順に並べた符号が形成される。
この実施例は、エントロピー符号化後に、符号のトランケーションをコードブロック単位で制御するものである。本実施例においては、前記各実施例と同様のサブバンド毎の視覚重みに加え、
(A)デコンポジションレベル1に関し、コードブロック単位での”櫛形指標”
(B)コードブロック毎の”マスキング指標”
の2つを考慮して、コードブロック毎のトランケーションを制御し、圧縮率を所望値付近に精密に制御する。コードブロックは、JPEG2000のトランケーションにおける画質制御単位である。
本実施例の処理フローを図31に示す。ステップS300,S301,S302,S304,S309,S310は図14の符号化処理手段100により実行されるステップであり、ステップS303,S305,S306,S307,S308は図14の符号化制御手段101により実行されるステップである。ステップ308のより詳細なフローを、図32に示す。以下、処理内容を順に説明する。
《ステップS300》
各フレームに対し、前述のDCレベルシフトとコンポーネント変換が実行される。
《ステップS301》
フレームの各コンポーネントに2次元のウェーブレット変換が適用される。ここでは、前述したように9×7ウェーブレット変換である。また、ここではデコンポジションレベル4までの変換が行われるものとする。
《ステップS302》
ウェーブレット係数は、サブバンド毎に、図22に示した基本量子化ステップ数を用いて量子化(正規化)される。
《ステップS303》
コードブロック毎のマスキング指標が算出される。
前述の通り、人間の視覚は、コントラスト強度自体の関数でもあり、同じ周波数帯域でも、コントラストが高いほど、コントラストの誤差(変化)に鈍感である。これは、コントラストの誤差を人間が感じる・感じないの閾値が、その誤差の絶対値ではなく相対的な大きさ(=誤差の値/原値という比率)に依存すること(所謂Weberの法則)によるものであり、その効果を”マスキング”という。あるコードブロックに含まれる係数の値(周波数変換した係数は、一般に原画像のコントラストを反映したものになるため、係数値の大小をコントラストの大小と見なせる)が大きいか小さいかを示す指標を、本明細書においては“マスキング指標”と呼ぶ。
一般に、典型的な“マスキング指標“として、
(コードブロックに含まれる係数の絶対値の和)/((コードブロックに含まれる係数の数)^α)
なる比が用いられる。実験的に、0<α≦1であると言われているので、本実施例においては、α=1に選ばれ、
各コードブロックのマスキング指標は、
マスキング指標
=(コードブロックに含まれる係数の絶対値の和)/(コードブロックに含まれる係数の数) (14)
により計算される。各コードブロック毎のマスキング指標は保持される。
《ステップS304》
全てのサブバンドの全てのビットプレーンについて、エントロピー符号化が行われる。この際に、各コードブロックの各ビットプレーンの符号量が保持される。また、各コードブロックの各ビットプレーン毎に、その符号が破棄された場合の量子化誤差量も計算されて保存される。
《ステップS305》
輝度コンポーネントの1LH,1HL,2LH,2HLサブバンドの符号量1Lhcode,1Hlcode,2Lhcode,2HLcodeから「符号量比」
(1Lhcode/1HLcode)/(2Lhcode/2HLcode)
を算出する。そして、「符号量比」と所定の閾値A,B(ただしA<B)との比較判定により、動き量は「小」(A未満)、「中」(A以上、B未満)、「大」(B以上)の3段階に評価される。
なお、この符号量比は画像全体としての動き量(櫛形量)の評価値であるので、本実施例においては、後述のように、コードブロック毎の「櫛形符号量指標」を求め、これを「符号量比」に基づいて決定された視覚重みに乗じることによって、コードブロック単位の動き量の微調整が行われる(ステップS307,S308参照)。
《ステップS306》
前記実施例1のステップS103に関連して説明したところと同様に、圧縮率(又は量子化誤差)と、動き量(=符号量比)とに基づいて図19に示す視覚重みA〜Eの1つを選択する。具体的には、図20又は図21に示した、いずれかの視覚重みの数値を選択する。
《ステップS307》
図10に関連したように、プリシンクトは原画像の同じ位置に対応した係数からなる3つの矩形であり、また、コードブロックはプリシンクトを分割したものであるため、「原画像の同じ位置に対応したコードブロック」が1HL,1LH,1HHサブバンド内に各々1つずつ存在する。よって、これらのコードブロックに含まれるウェーブレット係数や符号量は、原画像内での同じ位置に関するものとなる。
したがって、本出願人の先願である特願2002-300476号に係る発明の教えるように、コードブロック毎の櫛形の多寡を次の比
(当該コードブロックに含まれるLH係数の符号量)/(原画中で同じ位置のコードブロックに含まれるHL係数の符号量)
で評価することができる。
そこで、本実施例においては、各コードブロック毎の櫛形の多寡の指標として次の「櫛形符号量指標」を計算する。
櫛形符号量指標=((当該コードブロックに含まれる1LH係数の符号量)/(同じ位置のコードブロックに含まれる1HL係数の符号量))/((1LHサブバンドの全符号量)/(1HLサブバンドの全符号量)) (15)
なお、この櫛形符号量指標は、原画像中で同じ位置にある3つのコードブロックについては同じ値として扱う。
次のステップS308において、サブバンド全体の符号量比と圧縮率(又は量子化誤差)に基づいて決定された視覚重みに「櫛形符号量指標」が乗じられる。これにより、あるコードブロック位置の動き量がサブバンド全体の動き量より大きければ、そのコードブロックに関する重みの値は、その分だけ大きくなるように調整されるのである。言い換えれば、コード単位で動き量の微調整が行われるということである。
《ステップS307》
コードブロックの全てのビットプレーンをエントロピー符号化したときの、符号の基本的な重要度は
「その符号を破棄した場合の量子化誤差の増分×視覚重み/その符号量」
で評価される。
本実施例では、このステップにおいて、ある1つのビットプレーンの、ある1つのコードブロックの符号の重要度を次式により求める。
重要度=((その符号を破棄した場合の量子化誤差の増分)×視覚重み×櫛形符号量指標))/(マスキング指標×その符号量) (16)
視覚重みは,同一サブバンド内で共通であるが、櫛形符号量指標やマスキング指標はコードブロックによって異なるため、上式により計算される重みにより、コードブロック単位での符号の差別化が可能なのである。
そして、全コンポーネントのコードブロックの重要度を低い順にソートすることにより、どのコンポーネントの、どのコードブロックのビットプレーンの符号から破棄すべきか、その序列を求める。
なお、「その符号を破棄した場合の量子化誤差の増分」の求め方は種々存在し、数学的に厳密な方法は例えば非特許文献5に記載されている。
本実施例では、処理を簡易にするため、
「LSB(最下位ビット)から数えてn(n>0)枚目のビットプレーンの符号を破棄した場合の、1ウェーブレット係数あたりの量子化誤差」=2^(n−1)」
と見なす。ビットプレーンを下から1枚破棄するということは、誤差的観点からは係数を2で割ることと等価であり、その誤差は確率的には2^0=1だからである。そして、ウェーブレット係数は誤差的観点から正規化されているため、1ウェーブレット係数あたりの量子化誤差=RGB値の誤差として扱うことができる。よってこの場合、「コードブロックのLSBから数えてn枚目のビットプレーンの符号を破棄した場合の量子化誤差の増分」は次式により求められる。
量子化誤差の増分=
((2^(n−1)−2^(n−2))×当該コードブロックに含まれる係数の数 (17)
この処理ステップについて、図32のフローに沿ってさらに説明する。1つのコンポーネントを選び(ステップS320)、選ばれたコンポーネントの1つのコードブロックを選択する(ステップS322)。
選ばれたコードブロックについて、1つのビットプレーンを選び(ステップS324)、そのビットプレーンについて前記(16)式により重要度を計算する(ステップS326)。選ばれたコードブロックの全てのビットプレーンの重要度の計算が終わると(ステップS325,Yes)、ステップS322に戻り、選択されているコンポーネントの別の1つのコードブロックを選び、その各ビットプレーンについて重要度が計算される。
選択されているコンポーネントの全てのコードブロックについて重要度計算が終わると、ステップS320に戻り、別の1つのコンポーネントが選ばれ、そのコンポーネントに関する重要度の計算が繰り返される。全てのコンポーネントに関し重要度計算が終わると(ステップS321,Yes)、重要度のソートが行われ、符号破棄の序列が決定される(処理ステップS330)。
再び、図31を参照する。
《ステップS309》
重要度より決定された序列に従って、所望の符号量(圧縮率)になるまで、符号が破棄される。ただし、JPEG2000の仕様上、各コードブロックの符号はLSB側から順に捨てる必要があるため、それと序列が矛盾する場合には、符号の破棄順を調整する。
例えば、デコンポジションレベル=2の場合に、上記序列の一部が図33の様であったとする(図33においては、煩雑をさけるため、一部のコードブロックの一部のビットプレーンの1〜22までの序列が示されている)。この例では、序列「19」の符号よりも序列「21」の符号の方がLSB側にあるため、「18」→「20」→「21」→「19」の順で符号を破棄することになる。
なお、LSBから順に、かつ前記序列の順で符号を破棄する、処理の実装は、前述のようにソートによってもよいが、一般的なラグランジェの未定乗数法によってもよい。JPEG2000におけるラグランジェの未定乗数法の実装法について、非特許文献5に詳しい記載がある。
本実施例の一変形例について以下に説明する。この変形例においては、ステップS305において、前記実施例1と同様の「係数比」により動き量が評価される。また、ステップS306において、「櫛形符号量指標」に代えて、次式で計算されるコードブロック毎の「櫛形係数指標」が求められる。
櫛形係数指標=
((当該コードブロックに含まれる1LH係数の絶対値の和)/(同じ位置のコードブロックに含まれる1HL係数の絶対値の和))/((1LHサブバンドの全係数の絶対値の和)/(1HLサブバンドの全係数の絶対値の和)) (18)
また、ステップS308において、1つのビットプレーンの1つのコードブロックの重要度は次式で計算される。
重要度=
((その符号の破棄による量子化誤差の増分)×視覚重み×櫛形係数指標))/(マスキング指標×その符号量) (19)
本変形例及び前記実施例3と同様のコードブロック単位のトランケーションの制御を、前記実施例2のようなウェーブレット係数のトランケーションの制御にも応用可能である。
以上、本発明の実施の形態を、いくつかの実施例及び変形例に関し詳細に説明したが、本発明の実施の形態はそれのみに限定されるものではないことは明白である。
フィールド間の動きと櫛形を説明するための図である。 フィールド間の動きによる”残像現象”を説明するための図である。 2次元ウェーブレット変換の説明のための原画像と座標系を示す図である。 図3の原画像への垂直方向のフィルタリングにより得られる係数配列を示す図である。 図4の係数配列への水平方向のフィルリングにより得られる係数配列を示す図である。 図5の係数配列をデインターリーブした係数配列を示す図である。 2回のウェーブレット変換を行って得られた係数をデインターリーブした係数配列を示す図である。 デコンポジションレベルと解像度レベルの関係を示す図である。 JPEG2000の圧縮/伸長処理の流れを示すブロック図である。 画像、タイル、サブバンド、プリシンクト、コードブロックの関係を説明するための図である。 マルチレイヤー構造の一例を示す図である。 図11中のレイヤーを構成するパケットを示す図である。 視覚特性の例を示すグラフである。 本発明の実施の形態を説明するための装置構成図である。 本発明をコンピュータで実施する形態を説明するための図である。 本発明の実施例1における処理の流れを示すフローチャートである。 図16中のステップS103の処理フローを示すフローチャートである。 動き量と圧縮率又は量子化誤差に基づく視覚重みの決定方法を説明するための図である。 実施例において採用される、動き量と圧縮率又は量子化誤差に基づく視覚重みの決定方法を説明するための図である。 視覚重みの数値例を示す図である。 視覚重みの別の数値例を示す図である。 基本量子化ステップ数を示す図である。 量子化ステップ数の数値例を示す図である。 量子化ステップ数の別の数値例を示す図である。 2LLサブバンドの係数値例を示す図である。 図25の2LLサブバンドのビットプレーンを示す図である。 JPEG2000の符号構成例を示す図である。 本発明の実施例2における処理フローを示すフローチャートである。 トランケーション量の数値例を示す図である。 トランケーション量の別の数値例を示す図である。 本発明の実施例3における処理フローを示すフローチャートである。 図31中のステップS308の処理フローを示すフローチャートである。 符号破棄序列の例を示す図である。
符号の説明
100 符号化処理手段
101 符号化制御手段

Claims (22)

  1. インターレース画像のフレームベース符号化処理を行う符号化処理手段と、フレームを構成するフィールド間の動き量を検出し、該動き量、及び、圧縮率又は量子化誤差に基づいて、前記符号化処理手段における周波数係数の量子化を制御する符号化制御手段を有することを特徴とする符号化装置。
  2. インターレース画像のフレームベース符号化処理を行う符号化処理手段と、フレームを構成するフィールド間の動き量を検出し、該動き量、及び、圧縮率又は量子化誤差に基づいて、前記符号化処理手段における周波数係数又は符号のトランケーションを制御する符号化制御手段を有することを特徴とする符号化装置。
  3. 請求項1に記載の符号化装置において、符号化制御手段が画質制御単位毎に量子化を制御することを特徴とする符号化装置。
  4. 請求項2に記載の符号化装置において、符号化制御手段が画質制御単位毎にトランケーションを制御することを特徴とする符号化装置。
  5. 請求項1に記載の符号化装置において、符号化制御手段が周波数係数の周波数帯域毎に量子化を制御することを特徴とする符号化装置。
  6. 請求項2に記載の符号化装置において、符号化制御手段が周波数係数の周波数帯域毎にトランケーションを制御することを特徴とする符号化装置。
  7. 請求項1に記載の符号化装置において、符号化制御手段がウェーブレット変換のデコンポジションレベル毎に量子化を制御することを特徴とする符号化装置。
  8. 請求項2に記載の符号化装置において、符号化制御手段がウェーブレット変換のデコンポジションレベル毎にトランケーションを制御することを特徴とする符号化装置。
  9. 請求項1に記載の符号化装置において、符号化制御手段がウェーブレット変換のサブバンド毎に量子化を制御することを特徴とする符号化装置。
  10. 請求項2に記載の符号化装置において、符号化制御手段がウェーブレット変換のサブバンド毎にトランケーションを制御することを特徴とする符号化装置。
  11. 請求項9に記載の符号化装置において、符号化制御手段が同一解像度レベル中のサブバンドに関し、LHサブバンドの量子化を最も控えるように制御することを特徴とする符号化装置。
  12. 請求項10に記載の符号化装置において、符号化制御手段が同一解像度レベル中のサブバンドに関し、LHサブバンドのトランケーションを最も控えるように制御することを特徴とする符号化装置。
  13. 請求項7,9又は11に記載の符号化装置において、符号化制御手段がデコンポジションレベル1及びデコンポジションレベル2のみに関し量子化を制御することを特徴とする符号化装置。
  14. 請求項8,10又は12に記載の符号化装置において、符号化制御手段がデコンポジションレベル1及びデコンポジションレベル2のみに関しトランケーションを制御することを特徴とする符号化装置。
  15. 請求項1,3,5,7,9,11又は13に記載の符号化装置において、符号化制御手段が量子化の制御においてサブバンド毎の視覚重みを変えることを特徴とする符号化装置。
  16. 請求項2,4,6,8,10,12又は14に記載の符号化装置において、符号化制御手段がトランケーションの制御においてサブバンド毎の視覚重みを変えることを特徴とする符号化装置。
  17. 請求項2,4,6,8,10,12又は14に記載の符号化装置において、符号化制御手段がトランケーションの制御に画質制御単位毎のマスキングを反映させることを特徴とする符号化装置。
  18. 請求項2,4,6,8,10,12,14又は16に記載の符号化装置において、符号化制御手段がトランケーションの制御において画質制御単位毎に視覚重みを変更することを特徴とする符号化装置。
  19. インターレース画像のフレームベース符号化を制御する符号化制御方法であって、請求項1,3,5,7,9,11,13又は15に記載の符号化制御手段による動き量検出及び量子化制御のためのステップを含むことを特徴とする符号化制御方法。
  20. インターレース画像のフレームベース符号化を制御する符号化制御方法であって、請求項2,4,6,8,10,12,14,16,17又は18に記載の符号化制御手段による動き量検出及びトランケーション制御のためのステップを含むことを特徴とする符号化制御方法。
  21. 請求項19又は20に記載の動き量検出、及び、量子化制御又はトランケーション制御のためのステップをコンピュータに実行させるプログラム。
  22. 請求項21に記載のプログラムが記録された、コンピュータが読み取り可能な記録媒体。
JP2004173495A 2003-07-25 2004-06-11 符号化装置、符号化制御方法、プログラム及び記録媒体 Expired - Fee Related JP4219303B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2004173495A JP4219303B2 (ja) 2003-07-25 2004-06-11 符号化装置、符号化制御方法、プログラム及び記録媒体

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2003201911 2003-07-25
JP2004173495A JP4219303B2 (ja) 2003-07-25 2004-06-11 符号化装置、符号化制御方法、プログラム及び記録媒体

Publications (2)

Publication Number Publication Date
JP2005065230A true JP2005065230A (ja) 2005-03-10
JP4219303B2 JP4219303B2 (ja) 2009-02-04

Family

ID=34379820

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004173495A Expired - Fee Related JP4219303B2 (ja) 2003-07-25 2004-06-11 符号化装置、符号化制御方法、プログラム及び記録媒体

Country Status (1)

Country Link
JP (1) JP4219303B2 (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006287487A (ja) * 2005-03-31 2006-10-19 Ricoh Co Ltd 符号処理装置、符号処理方法、プログラム及び情報記録媒体
JP2009206938A (ja) * 2008-02-28 2009-09-10 Ricoh Co Ltd 符号化装置、符号処理装置、符号化方法、符号処理方法、コンピュータプログラム及び記録媒体
JP2010232892A (ja) * 2009-03-26 2010-10-14 Nippon Hoso Kyokai <Nhk> スレッショルド関数制御型ウェーブレットシュリンケージ雑音除去装置及びプログラム
JP2012501095A (ja) * 2008-08-29 2012-01-12 ジーブイビービー ホールディングス エス.エイ.アール.エル. インタレース画像の符号化方法、符号化装置、及び符号化プログラム

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006287487A (ja) * 2005-03-31 2006-10-19 Ricoh Co Ltd 符号処理装置、符号処理方法、プログラム及び情報記録媒体
JP2009206938A (ja) * 2008-02-28 2009-09-10 Ricoh Co Ltd 符号化装置、符号処理装置、符号化方法、符号処理方法、コンピュータプログラム及び記録媒体
JP2012501095A (ja) * 2008-08-29 2012-01-12 ジーブイビービー ホールディングス エス.エイ.アール.エル. インタレース画像の符号化方法、符号化装置、及び符号化プログラム
JP2010232892A (ja) * 2009-03-26 2010-10-14 Nippon Hoso Kyokai <Nhk> スレッショルド関数制御型ウェーブレットシュリンケージ雑音除去装置及びプログラム

Also Published As

Publication number Publication date
JP4219303B2 (ja) 2009-02-04

Similar Documents

Publication Publication Date Title
US7483575B2 (en) Picture encoding apparatus and method, program and recording medium
JP4444790B2 (ja) 画像圧縮方法、画像圧縮装置、画像圧縮システム、プログラム
JP4254017B2 (ja) 画像符号化装置及び方法
JP3702778B2 (ja) 画像符号化装置及び方法
US8000542B2 (en) Apparatus and method for processing image data based on object movement speed within a frame
JP3743384B2 (ja) 画像符号化装置及び方法、並びに画像復号装置及び方法
US7308146B2 (en) Digital video compression
US5737448A (en) Method and apparatus for low bit rate image compression
JP4017112B2 (ja) 符号化データ生成装置及び方法、プログラム並びに情報記録媒体
JP4229323B2 (ja) 符号化装置、符号化方法及びプログラム
JP4449400B2 (ja) 画像符号化装置及び方法、並びにプログラム及び記録媒体
US20050084168A1 (en) Image encoding apparatus and method
JP4219303B2 (ja) 符号化装置、符号化制御方法、プログラム及び記録媒体
EP1322116A2 (en) Image compression device, method for image compression, and electronic camera
WO2005043919A1 (en) Image decoding apparatus and image decoding method
JP4003628B2 (ja) 画像符号化装置及び方法、並びにプログラム
JP4379869B2 (ja) 動画像処理装置、プログラム及び情報記録媒体
JP4636547B2 (ja) 符号化装置、プログラム及び情報記録媒体
JP4124436B2 (ja) 動き量推定装置、プログラム、記憶媒体および動き量推定方法
JP3897253B2 (ja) 画像処理方法、画像処理装置、撮像装置、プログラム及び記録媒体
JP4396932B2 (ja) 動画像処理装置、プログラム及び情報記録媒体
JP2004350034A (ja) 画像符号化装置及び方法、並びに画像復号装置及び方法
JP3983657B2 (ja) 画像処理装置及び画像処理方法
JP2004112382A (ja) 符号列変換装置、画像処理装置、画像記録装置、プログラム、記憶媒体および符号量削減方法
JP2008245296A (ja) 符号化装置及び方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060608

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20080708

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080827

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20081024

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20081110

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20081111

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111121

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111121

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111121

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121121

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131121

Year of fee payment: 5

LAPS Cancellation because of no payment of annual fees