JP5123168B2 - 量子化きざみを局所的に調整する方法 - Google Patents

量子化きざみを局所的に調整する方法 Download PDF

Info

Publication number
JP5123168B2
JP5123168B2 JP2008504727A JP2008504727A JP5123168B2 JP 5123168 B2 JP5123168 B2 JP 5123168B2 JP 2008504727 A JP2008504727 A JP 2008504727A JP 2008504727 A JP2008504727 A JP 2008504727A JP 5123168 B2 JP5123168 B2 JP 5123168B2
Authority
JP
Japan
Prior art keywords
region
interest
quantization
image
quantization step
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2008504727A
Other languages
English (en)
Other versions
JP2008535423A (ja
Inventor
ユグネル,リラ
トロー,ドミニク
ギヨテル,フィリップ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Thomson Licensing SAS
Original Assignee
Thomson Licensing SAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Thomson Licensing SAS filed Critical Thomson Licensing SAS
Publication of JP2008535423A publication Critical patent/JP2008535423A/ja
Application granted granted Critical
Publication of JP5123168B2 publication Critical patent/JP5123168B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/189Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding
    • H04N19/192Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding the adaptation method, adaptation tool or adaptation type being iterative or recursive
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/167Position within a video image, e.g. region of interest [ROI]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/132Sampling, masking or truncation of coding units, e.g. adaptive resampling, frame skipping, frame interpolation or high-frequency transform coefficient masking
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/152Data rate or code amount at the encoder output by measuring the fullness of the transmission buffer
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/154Measured or subjectively estimated visual quality after decoding, e.g. measurement of distortion
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/179Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a scene or a shot
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

本発明は、画像の系列を事前解析するステップを使って、ある系列の諸画像における量子化きざみを局所的に調整する方法に関する。
本発明はビデオ圧縮、特に選択的圧縮の分野に適用される。関心領域をもつ画像の選択的圧縮のいかなる方法も二つの機構に関わる:先験的選択機構および先験的圧縮機構である:
・情報の選択は視覚的な注意機構であり、画像中に含まれる関心のあるイベントの位置およびこれらのイベントの互いとの関係での相対的な重要性を定義する;
・先験的圧縮機構は、画像の性質およびエンコードならびにエンコード資源すなわちビットレートまたは品質の割り当ての基準を特徴付ける。
いかなる圧縮方法もエンコードされるべきデータを量子化するための量子化方法に関わる。本発明は、より詳細には、画像中の各領域についての量子化きざみの局所的な調整に関する。従来式のアプローチでは、量子化きざみの局所的調整は各マクロブロックについて(あるいは各ピクセル・ブロックについて)画像内でのその視覚心理学的重要性に基づいて実行される。こうしたアプローチは特に、それほど重要でないマクロブロックをより強く量子化し、逆に重要なマクロブロック(目を引くマクロブロック)は関連する量子化きざみを小さくすることによって保存するために使用される。しかしながら、こうしたアプローチでは、重要なマクロブロックの再構成品質(すなわちデコード後の)は、ある画像と次の画像とで強く変動することがあり、観察者にとって問題となる。さらに、再構成品質は関心領域内でも変動しうる。
本発明の目的は、従来技術の欠点の少なくとも一つを解決することである。本発明は、設定点の量子化きざみ(QP*)に対して、n画像からなる系列の画像中の量子化きざみを局所的に調整するための方法に関する。各画像は少なくとも一つの関心領域(region of interest)および一つの有力マスキング領域(potential masking region)を有し、各領域は可能性としてはいくつかの相異なるグループのピクセルを有している。関心領域および有力マスキング領域は、設定点の量子化きざみで量子化されるときにそれぞれ第一のビット数および第二のビット数でエンコードされる。本発明によれば、本方法は以下のステップを有する:
・当該系列の各画像について、第二のビット数と、設定点の量子化きざみ(QP*)以上の第一の量子化きざみ(QP_POT_MAXj)で量子化された有力マスキング領域をエンコードするために使われるビット数との間の第一のビット差、ならびに、設定点の量子化きざみ(QP*)以下の第二の量子化きざみ(QP_ROI_MINj)で量子化された関心領域をエンコードするために使われるビット数と、第一のビット数との間の第二のビット差を計算し;
・当該系列の各画像において、有力マスキング領域に第一の量子化きざみを割り当て、当該系列のn枚の画像にわたってn個の第一のビット差の和(GPOT)がn個の第二のビット差の和(DROI)より大きい場合には、関心領域に第二の量子化きざみを割り当て、それ以外の場合には第二の量子化きざみ以上の第三の量子化きざみを関心領域に割り当て、それにより前記n個の第一のビット差の和が、当該系列の画像の関心領域の間で、各画像について計算された再構成品質基準に従って、分配されるようにする。
ある個別的な実施形態によれば、第一の量子化きざみ(QP_POT_MAXj)は、該第一の量子化きざみが有力マスキング領域を符号化するために使われるときに該有力マスキング領域の第一の所定の再構成品質(PSNRmin POT)を保証するよう、決定される。第二の量子化きざみ(QP_ROI_MINj)は、該第二の量子化きざみ(QP_ROI_MINj)が関心領域を符号化するために使われるときに該関心領域の第二の所定の再構成品質(PSNRmax ROI)を保証するよう、決定される。
好ましくは、当該系列のn枚の画像にわたって、n個の第一のビット差の和(GPOT)がn個の第二のビット差の和(DROI)より小さい場合には、n個の第一のビット差の和(GPOT)は、第二の所定の再構成品質(PSNRmax ROI)と、設定点の量子化きざみ(QP*)をその関心領域の符号化に使うときのその関心領域の再構成品質との間の差に基づいて、当該系列のn枚の画像の関心領域の間で比例配分される。
もう一つの実施形態によれば、前記画像はさらに中立領域を有しており、該中立領域は可能性としては離散した(disjoint)諸グループのピクセルを有しており、該中立領域には設定点の量子化きざみ(QP*)が割り当てられる。
本発明はまた、n枚の画像の系列を符号化する方法であって、n枚の画像を一組の係数に変換するステップと、前記係数のそれぞれを量子化きざみによって量子化するステップと、量子化された係数をエンコードするステップとを有しており、前記量子化きざみが上記の方法に従って局所的に調整される方法にも関する。
本発明はまた、少なくとも一つの関心領域および一つの有力マスキング領域を有するn枚の画像の系列を符号化する符号化装置に関する。該装置は:
・n枚の画像のそれぞれを一組の係数に変換する手段と;
・前記係数を、設定点の量子化きざみ(QP*)に関して前記系列の各画像において局所的に調整された量子化きざみを用いて量子化し、その際、関心領域および有力マスキング領域は設定点の量子化きざみ(QP*)で量子化されるときにそれぞれ第一のビット数および第二のビット数でエンコードされるような、量子化手段と;
・量子化された係数を符号化する符号化手段とを有している。
本発明によれば、前記量子化手段は:
・当該系列の各画像について、第二のビット数と、設定点の量子化きざみ(QP*)以上の第一の量子化きざみ(QP_POT_MAXj)で量子化された有力マスキング領域をエンコードするために使われるビット数との間の第一のビット差、ならびに、設定点の量子化きざみ(QP*)以下の第二の量子化きざみ(QP_ROI_MINj)で量子化された関心領域をエンコードするために使われるビット数と、第一のビット数との間の第二のビット差を計算する手段と;
・当該系列の各画像において、有力マスキング領域に第一の量子化きざみを割り当て、当該系列のn枚の画像にわたってn個の第一のビット差の和(GPOT)がn個の第二のビット差の和(DROI)より大きい場合には、関心領域に第二の量子化きざみを割り当て、それ以外の場合には第二の量子化きざみ以上の第三の量子化きざみを関心領域に割り当て、それにより前記n個の第一のビット差の和が、各画像について計算された再構成品質基準に従って、当該系列の画像の関心領域の間で分配されるようにする手段とを有する。
有利には、前記符号化装置はさらに、設定点の量子化きざみ(QP*)による量子化手段を提供するレート制御手段を有する。
本発明は、付属の図面を参照しつつ、決して限定するものではない例示的な実施形態および有利な実装によってよりよく理解され、例解されるであろう。
本発明は、画像の関心のある各領域または区域(すなわち、より注目を引く領域)について、量子化きざみを設定点の量子化きざみ(QP*)に対して局所的に調整する方法に関する。いくつかの画像からなる系列の一部である画像は、ピクセルのブロックからなる。量子化きざみを局所的に適応させる方法において、画像の他の領域を犠牲にして関心のある空間領域を厚遇することによって、与えられた全体的なビットレートについて、関心領域の視覚的な品質が向上する。画像中における関心領域の選択に基づいて、量子化きざみはこれらの領域の関心に従って局所的に調整される。この調整は、重要性の低い領域をより強く圧縮して、使われないことがありうるエンコード資源(すなわち、ビット数)を系列に沿って関心領域に再分配する。ある画像から別の画像へのビットのこの再分配により、関心領域についてより安定した再構成品質(すなわち復号後品質の)を得ることが可能になる。本発明に基づく方法は、画像系列事前解析ステップを使って、特に、当該系列中の関心領域のビット数の点での要件を特徴付け、その結果として系列全体にわたって関心領域の再構成品質をなめらかにする。
より具体的には、本発明に基づく方法は、非関心領域から関心領域にビットレートを移転するために使われることができる。このために、提案される解決策は、画像中の各領域について量子化きざみQPの変動すなわち量子化きざみの局所的調整を用いる。この調整は、QP*と表される量子化きざみの値の初期設定点(たとえば、各画像についてのビットレート制御から導出される)に対してなされる。この量子化きざみQP*は設定点のビットレートD*に対応する。この量子化きざみの値は、必要なら、系列の間に画像から画像へと変わってもよい。より具体的には、本発明によれば、画像の各領域についての量子化きざみは、領域の視覚的関心に従って修正される。量子化きざみの正方向の変動は、品質低下を代償としてより強い圧縮、すなわちビットレートの利得を与える。負方向の変動は、エンコード・コストの上昇を代償としてより細かな圧縮、すなわち向上した再構成品質を与える。
したがって、本方法はコンテンツについての先験的な情報を知ることを要求する。本発明に基づく方法によって使用されるこの先験的情報は二つのカテゴリーにはいる。コンテンツについての先験的情報の第一のカテゴリーは、系列の各画像において、より多くの注目を集める領域すなわち関心領域の位置に関するものである。この領域は、離散した諸グループのピクセル・ブロックからなっていてもよいが、それでも同一の領域として定義される。この情報は、画像中の各ブロックbiについて人間の視覚系にとっての関心のレベルを示す二値の関心マップIによって与えられることができる:関心のあるブロックbiについてはI(bi)=1であり、関心のないブロックbiについてはI(bi)=0である。このマップは、たとえば、顕著性マップを閾値処理することによって得ることができる。顕著性マップとは、画像中の各ピクセルについてその知覚的関心を示すマップである。このマップは、動き情報などの多様な情報を考慮して構築できる。ピクセルに関連付けられる値が大きいほど、そのピクセルは目を引くことになる。各ブロックについての顕著性値を得るためには、所与のブロックについて、そのブロックに属するピクセルに関連付けられた値を平均することが考えられる。あるいはそれらの顕著性値の中央値を取るのでもよい。より一般的にいえば、本発明は、各ブロックbiについてその関心レベルを特徴付ける関心の二値でないマップの場合にも適用できる。コンテンツについての先験的情報の第二のカテゴリーは、系列の各画像において、視覚的アーチファクトに対する強いマスキング機能を有する画像の領域の位置に関するものである。この領域は、離散した諸グループのピクセル・ブロックからなっていてもよい。デジタル・ビデオ・システムにおいて使用される非可逆圧縮法はアーチファクトを生じるが、その可視性は処理される画像の内容に強く依存する。コントラスト・マスキング効果は、信号の可視性のこの修正を別の信号の存在に変換する。この修正は、可視性閾値の低下の方向に行く(容易化[facilitation])こともできるし、可視性閾値の増加の方向に行く(マスキング)ことさえできる。非関心領域の部分であるブロックにおける新たなアーチファクトの出現を制限するために、コンテンツに対する先験的情報は、各ブロックbiについてその視覚的なマスキング能力を示す二値のマップPによっても与えられる:マスキング能力の強いブロックについてはP(bi)=1であり、マスキング領域の弱いブロックbiについてはP(bi)=0である。このマップは、たとえば、活動性マップを閾値処理することによって得ることができる。活動性マップとは、所与のブロックについてその活動性のレベルを示すマップである。このレベルは、たとえばブロックの分散を測定することによって計算できる。本稿では、以下、強いマスキング能力をもつ画像中の非関心領域のブロックbiの集合は「有力マスキング領域(potential masking region)」と呼ばれる。有力マスキング領域に属さない非関心領域のブロックbiの集合は「中立領域(neutral region)」と呼ばれる。関心領域の位置およびマスキング能力が強い領域にそれぞれ関係する二つの二値マップは結合されて単一のマップIfinalが得られ、これが、量子化きざみを局所的に調整するために使用されるものであり、画像中の各ブロックbiに次のように値0、1または2を関連付ける:
Figure 0005123168
ここで:
・IFinalはエンコーダに送信される新しいマップであり、関心領域および有力マスキング領域をも示し、このマップからビットの移転が適用されることになる;
・Pは有力マスキング領域を定義する二値マップ;
・Iは関心領域および非関心領域を定義する二値マップ。
本方法は、PSNR(QP)曲線(ピーク信号対雑音比[peak signal-to-noise ratio]を量子化きざみの関数として表す曲線)およびNbBit(QP)曲線(ビット数[the number of bits]を量子化きざみの関数として表す曲線)をも使用する。これらの曲線は、系列の各画像における関心領域および有力マスキング領域のそれぞれに固有であり、関連付けられている。PSNRは、画像品質を特徴付けるのに使われる基準である。この場合、PSNRは、画像、ブロックまたは画像中の領域を復号した後の再構成品質を特徴付けるために使用される。そこで、PSNRは次のように定義される:
Figure 0005123168
ここで、SSEは平方誤差和(sum of the squared errors)である。SSEは、あるブロックについて、源画像中のピクセルに関連付けられた値と再構成された画像、すなわち復号画像中の対応するピクセルに関連付けられた値とのピクセルごとの差の当該ブロック上での和によって定義される。
本発明によれば、他の品質基準も使うことができる。画像のある領域から他の領域にビットを再分配する前に、値QP*のまわりで上に定義した曲線の部分を構築するために、系列の各画像jについての学習ステップが必要とされる。これらの曲線部分は、データ・ファイルを通じてなど、外的手段によって提供されてもよい。それは、三つの異なる量子化きざみ:QP*−L、QP*+KおよびQP*を使って、画像jの関心領域または有力マスキング領域のいずれかに属する各ピクセル・ブロック(たとえば、16×16ピクセルの大きさのマクロブロック)をエンコードすることからなる。関心領域に属するエンコードされたブロックの再構成(すなわち復号)後、所与の量子化きざみの値(QP*−L、QP*+KまたはQP*)についてこれらのブロックに関係するデータ(PSNRおよびNbBit)が平均されて、画像j中の該関心領域について、かつ三つの量子化きざみの値それぞれについて、PSNR値(PSNRj ROI)およびビット数の値(NbBitj ROI)が得られる。同様に、有力マスキング領域に属するブロックに関係するデータが平均されて、画像j中の該有力マスキング領域について、かつ三つの量子化きざみの値それぞれについて、PSNR値(PSNRj POT)およびビット数の値(NbBitj POT)が得られる。すると、三つの値QP*−L、QP*+KおよびQP*の間の線形補間によって、曲線PSNRj(QP)およびNbBitj(QP)が補間され、画像jについて、関心領域については曲線PSNRj ROI(QP)およびNbBitj ROI(QP)が、有力マスキング領域については曲線PSNRj POT(QP)およびNbBitj POT(QP)が得られる。
ビットの移転または再分配の原理は、有力マスキング領域に属するブロックはより強く(設定点の量子化きざみQP*に基づく初期エンコードを基準として)圧縮し、有力マスキング領域のエンコードに使用されない(NbBitj POT(QP*)を基準として)ビットを関心領域のエンコードのために使用することにある。本方法によれば、有力マスキング領域のブロックを量子化するためには、有力マスキング領域に関連した再構成品質の最低限の所定の値PSNRmin POT(たとえば20dB)が尊重される限りにおいて、より強い量子化きざみが使われることができる。同様に、関心領域については、再構成品質の最大の所定の値PSNRmax ROIが設定される(たとえば35dB)。これらの値は自動的に設定されることもできるし、手動で(たとえばオペレーターによって)設定されることもできる。本発明に基づく方法は、当該系列について設定点ビットレートD*とほぼ同様の全体的なビットレートを維持するよう注意しつつ、有力マスキング領域から関心領域にビットを移転させることによって、量子化きざみを局所的に適応させることにある。本発明に基づく方法は、第一の系列事前解析ステップを使用する。このステップでは、有力マスキング領域に割り当てられた量子化きざみを大きくすることによって系列全体にわたって回収または節約できるビット数が計算され、同様に、関心領域をより細かい量子化きざみでエンコードするために系列全部にわたって要求される追加的なビット数が計算される。この目的に向け、本選択的圧縮システムに関わる各領域(すなわち関心領域および有力マスキング領域)について、そして系列の各画像jについて、量子化きざみについてのいわゆる有効な値の集合が定義される。これらの値は、有力マスキング領域および関心領域においてそれぞれ最小PSNR要件および最大PSNR要件を満足する再構成品質を尊重するよう、PSNR(QP)曲線(各領域についておよび各画像についてモデル化される)から決定される。画像jにおける有力マスキング領域について、有力マスキング領域に割り当てられることのできる量子化きざみの値は、QP*で表される設定点の値と、最低限の再構成品質PSNRmin POTを保証できるようにする最高値(QP_POT_MAXjと記す)との間で変動する。同じ原理は関心領域に適用される。画像jにおける関心領域に割り当てられることのできる量子化きざみの値は、目標再構成品質PSNRmax POTを達成できるようにする量子化きざみの最小値(QP_ROI_MINjと記す)と設定点の値QP*との間で変動する。
本発明によれば、事前解析ステップはまず、系列の各画像について、関心領域のビット数に関する要求と、有力マスキング領域が提供できるビット数とを収集することを含む。第二に、ビットの移転は、系列を通じて有力マスキング領域によってもたらされる可能性に基づく。二つの結末が考えられる:有力マスキング領域が要求を満たすことができるか、できないかである。後者の場合、ビットの再分配は、PSNRベースの品質の設定点に対する関心領域のPSNR不足分に比例して実行される。
事前解析においては、系列の各画像jについて、有力マスキング領域をQP_POT_MAXjでエンコードするときに節約できるビット数が、該領域に関連付けられた曲線NbBitj POT(QP)から決定される。目標再構成品質PSNRmax ROIを達成するための追加的なビットに関する関心領域の要求も評価される。最低限の再構成品質を提供する最大量子化きざみを用いたエンコードについて画像jの有力マスキング領域から節約されるビット数を表すのに項gainj(QP_POT_MAXj)を使うとすると、
gainj(QP_POT_MAXj)=NbBitj POT(QP*)−NbBitj POT(QP_POT_MAXj)
ここで:
・NbBitj POT(QP)は画像jの有力マスキング領域に関連付けられた曲線NbBit(QP)。
・QP_POT_MAXjは、有力マスキング領域の最低限の再構成品質を提供するために使うことのできる量子化きざみの値。
目標再構成品質を満足する画像jの関心領域によって要求されるビット数を表すのに項requirementj(QP_ROI_MINj)を使うとすると、
requirementj(QP_ROI_MINj)=NbBitj ROI(QP_ROI_MINj)−NbBitj ROI(QP*)
ここで:
・NbBitj ROI(QP)は画像jの関心領域に関連付けられた曲線NbBit(QP)。
・QP_ROI_MINjは、目標再構成品質に近い関心領域の再構成品質を保証するために使うことのできる量子化きざみの値。
この画像解析では、有力マスキング領域で節約されるビット数(GPOTと記す)および関心領域によって要求されるビット数(DROIと記す)が系列を通じて集約される。
Figure 0005123168
ここで、Nはエンコードされるべき画像の数である。
さらに、設定点のきざみで量子化される関心領域の再構成品質と目標再構成品質PSNRmax ROIとの間の品質差(我々のアプローチではPSNRによって評価されるが、これに制約されない)が、図1によって示されるように系列の各画像jについて計算される。ΔPSNRROIを、系列を通じたこれらの品質差の集約値とする。よって
Figure 0005123168
ここで:
・δPSNRj ROI=MAX(0,PSNRmax ROI−PSNRj ROI(QP*))は画像jの関心領域の品質差であり;
・Nはエンコードされるべき系列の画像数であり;
・PSNRj ROI(QP*)は画像jの関心領域のPSNRの値である。
この事前解析の最後には、次の値が知られる:
・画像レベルでは:
・関心領域の目標再構成品質からの品質距離;
・それぞれ最低再構成品質PSNRmin POTおよび目標再構成品質PSNRmax ROIを達成するためにそれぞれ有力マスキング領域および関心領域に適用できる量子化きざみQP_POT_MAXjおよびQP_ROI_MINj
・系列レベルでは:
・関心領域の、目標再構成品質に比べた品質差の集約値ΔPSNRROI
・有力マスキング領域GPOT上で節約される総ビット数
・目標再構成品質を達成するために関心領域によって要求される総ビット数DROI
本方法の第二のステップのねらいは、量子化きざみQP_POT_MAXjを用いた有力マスキング領域のエンコードから導かれる、系列を通じて節約されるビット数を、適宜、関心領域の目標再構成品質を満たすために再分配することによって、系列の各画像中の各領域について量子化きざみを割り当てることである。この分配は、実際上、有力マスキング領域が提供する能力、すなわち有力マスキング領域が要求を満たすことができるか(場合1)、できないか(場合2)に従ってなされる。
場合1:GPOT≧DROI
系列を通じて節約される総ビット数が、目標再構成品質を達成するために関心領域によって要求される総ビット数以上である。有力マスキング領域から節約されたビットの、系列を通じての関心領域への再分配ができる。この場合、全体としてのビットレートを下げることができる。
関心領域および有力マスキング領域の量子化きざみの局所的調整は、各画像jについて、それぞれの値QP_ROI_MINjおよびQP_POT_MAXjに基づいて直接実行される。すなわち、QP_ROI_MINjが有力マスキング領域に割り当てられ、QP_POT_MAXjが関心領域に割り当てられる。
場合2:GPOT<DROI
系列を通じて集約されたビットレート節約が関心領域の要求を完全には満たすことができない。
量子化きざみの局所的調整後に設定点のビットレート(設定点の量子化きざみによって得られる)とほぼ同様の全体としてのビットレートを保持するために、現在の値QP_ROI_MINjより大きい、関心領域についての新たな量子化きざみの値QP_ROIjを各画像jについて評価しなければならない。その際、ビットの再分配は、PSNRベースの品質設定点に対する関心領域のPSNR不足分に比例してなされる。各画像jについて、現在の関心領域のエンコードのために追加される追加ビット数NbAdditionalBitsj ROIは、現在の品質差δPSNRj ROIに比例するように、有力マスキング領域から得られる総ビット数から、次のように計算される:
Figure 0005123168
曲線NbBitj ROI(QP)から、新たな目標ビット数NbBitj ROI(QP*)+NbAdditionalBitsj ROIに近づくために使うことのできる関心領域の量子化きざみQP_ROIjの値が推定される。
関心領域および有力マスキング領域の量子化きざみの局所的調整は、各画像jについて、それぞれの値QP_ROIjおよびQP_POT_MAXjに基づいて実行される。中立領域のブロックについては、選択的エンコード方針に関して中立的であると考えられる。すなわち、これらのブロックに割り当てられる量子化きざみは、設定点の量子化きざみQP*に対応する、すなわち量子化きざみの局所的適応はない。
本発明はまた、本発明に基づく量子化方法を実装するn枚の画像の系列を符号化するための符号化方法にも関する。該符号化方法は、前記系列のn枚の画像を一組の係数に、たとえばDCTを使って変換するステップと、前記係数を上記の方法に従って前記系列のn枚の画像内で局所的に適応された量子化きざみによって量子化するステップと、前記量子化された係数を(たとえばエントロピー符号化プロセスを使って)エンコードするステップとを有する。
本発明はまた、図2に描かれている、画像の系列を符号化する符号化装置10にも関係する。図2には本質的なモジュールのみが描かれており、これから述べる。本符号化装置は、本符号化装置の入力の源画像を一組の係数(たとえばDCT係数)に変換するモジュール110を有する。モジュール110はたとえばDCT変換を実装するものである。次いで前記係数は、量子化モジュール120で量子化され、量子化された係数が得られる。量子化モジュール120は、本発明に基づく量子化きざみの局所的調整の方法を実装するよう適応されている。より具体的には、量子化モジュール120は系列の各画像の関心領域に量子化きざみを割り当てる。その際、節約されるビット数GPOTが十分であれば再構成品質を保証するように、あるいはこの節約されたビット数GPOTが系列全体にわたる関心領域の間で、目標再構成品質と設定点再構成(すなわち当該関心領域をQP*で量子化するときに得られる品質)との間の差に比例して分配されるようにする。次いで量子化された係数は、当業者に知られている符号化モジュール130、たとえばエントロピー・エンコーダによってエンコードされる。ある個別的な実施形態によれば、符号化装置10はレート制御モジュール140を有する。モジュール140は、量子化モジュール120に設定点の量子化きざみQP*を提供することもできる。
もちろん、本発明は上述した実施形態に限定されるものではない。特に、当業者は、開示された実施形態にいかなる変形をも加えることができ、それらを組み合わせてさまざまな利点から裨益することができる。従来式のPSNR以外の基準を、画像の、ピクセルのブロックのあるいは画像中のある領域の再構成品質を特徴付けるために使うこともできる。たとえば、分散に基づいて重み付けされたPSNR、視覚心理学的モデリングに基づいた基準などである。同様に、PSNR(QP)およびNbBit(QP)の曲線は、記載した以外の手段で得ることもできる。よって、曲線を補間するために三つよりも多い量子化きざみを使うこともできる。同様に、たとえば多項式補間のような別の種類の補間を使うこともできる。
関心マップは、画像中の各ブロックについて関心レベルの高低を特徴付ける、二値でないマップであることもできる。これらのマップは、画像中でいくつかの関心領域を定義し、各領域のためにその関心レベルに従ってビットが再割り当てされるようにするために使うことができる。
エンコードされるべき系列の各画像についての関心領域のPSNRの傾向を示す図である。 本発明に基づく符号化装置を描く図である。

Claims (10)

  1. 設定点の量子化きざみに対して、n画像からなる系列の画像中の量子化きざみを局所的に調整するために調整手段が実行する方法であって、前記画像は少なくとも一つの関心領域および一つの有力マスキング領域を有し、有力マスキング領域とは、活動性のレベルが閾値より高い非関心領域であり、該領域のそれぞれは可能性としてはいくつかの離散したグループのピクセルを有しており、前記関心領域および有力マスキング領域は、前記設定点の量子化きざみで量子化されるときにそれぞれ第一のビット数および第二のビット数でエンコードされるものであり、当該方法は:
    ・当該系列の各画像について、前記第二のビット数と、設定点の量子化きざみ以上の第一の量子化きざみで量子化された前記有力マスキング領域をエンコードするために使われるビット数との間の第一のビット差、ならびに、設定点の量子化きざみ以下の第二の量子化きざみで量子化された前記関心領域をエンコードするために使われるビット数と、前記第一のビット数との間の第二のビット差を計算し;
    ・当該系列の各画像において、有力マスキング領域に前記第一の量子化きざみを割り当て、当該系列のn枚の画像にわたってn個の第一のビット差の和がn個の第二のビット差の和より大きい場合には、前記関心領域に前記第二の量子化きざみを割り当て、それ以外の場合には前記第二の量子化きざみ以上の第三の量子化きざみを前記関心領域に割り当て、それにより前記n個の第一のビット差の和が、当該系列の諸画像の関心領域の間で、各画像について計算された再構成品質基準に従って、分配されるようにする、
    ステップを有することを特徴とする方法。
  2. 前記第一の量子化きざみは、該第一の量子化きざみが前記有力マスキング領域を符号化するために使われるときに該有力マスキング領域の第一の所定の再構成品質を保証するよう決定される、請求項1記載の方法。
  3. 前記第二の量子化きざみは、該第二の量子化きざみが前記関心領域を符号化するために使われるときに該関心領域の第二の所定の再構成品質を保証するよう決定される、請求項1または2記載の方法。
  4. 当該系列の前記n枚の画像にわたって、前記n個の第一のビット差の和が前記n個の第二のビット差の和より小さい場合には、前記n個の第一のビット差の和は、前記第二の所定の再構成品質と、前記設定点の量子化きざみを前記関心領域の符号化に使うときの前記関心領域の再構成品質との間の差に基づいて、当該系列の前記n枚の画像の関心領域の間で比例配分される、請求項3記載の方法。
  5. 前記画像がさらに中立領域を有しており、該中立領域は可能性としては離散した諸グループのピクセルを有しており、該中立領域には設定点の量子化きざみが割り当てられる、請求項1ないし4記載の方法。
  6. n枚の画像の系列を符号化する方法であって、前記n枚の画像を一組の係数に変換するステップと、前記係数のそれぞれを量子化きざみによって量子化するステップと、前記量子化された係数をエンコードするステップとを有しており、前記量子化きざみが請求項1ないし5のうちいずれか一項記載の方法に従って局所的に調整される方法。
  7. 少なくとも一つの関心領域および一つの有力マスキング領域を有する画像n枚の系列を符号化する符号化装置であって、有力マスキング領域とは、活動性のレベルが閾値より高い非関心領域であり、該領域のそれぞれは可能性としてはいくつかの離散したグループのピクセルを有しており、当該装置は
    ・前記n枚の画像のそれぞれを一組の係数に変換する手段と
    ・前記係数を、設定点の量子化きざみに関して前記系列の各画像において局所的に調整された量子化きざみを用いて量子化し、その際、前記関心領域および有力マスキング領域は前記設定点の量子化きざみで量子化されるときにそれぞれ第一のビット数および第二のビット数でエンコードされるような、量子化手段と
    ・前記量子化された係数を符号化する符号化手段とを有しており;
    前記量子化手段が
    ・当該系列の各画像について、前記第二のビット数と、設定点の量子化きざみ以上の第一の量子化きざみで量子化された前記有力マスキング領域をエンコードするために使われるビット数との間の第一のビット差、ならびに、設定点の量子化きざみ以下の第二の量子化きざみで量子化された前記関心領域をエンコードするために使われるビット数と、前記第一のビット数との間の第二のビット差を計算する手段と;
    ・当該系列の各画像において、有力マスキング領域に前記第一の量子化きざみを割り当て、当該系列の前記n枚の画像にわたってn個の第一のビット差の和がn個の第二のビット差の和より大きい場合には、前記関心領域に前記第二の量子化きざみを割り当て、それ以外の場合には前記第二の量子化きざみ以上の第三の量子化きざみを前記関心領域に割り当て、それにより前記n個の第一のビット差の和が、各画像について計算された再構成品質基準に従って、当該系列の諸画像の関心領域の間で分配されるようにする手段とを有する、
    ことを特徴とする装置。
  8. 前記設定点の量子化きざみによる前記量子化手段を提供するレート制御手段をさらに有する、請求項7記載の符号化装置。
  9. 前記活動性のレベルが前記有力マスキング領域の分散である、請求項1記載の方法。
  10. 前記活動性のレベルが前記有力マスキング領域の分散である、請求項7記載の装置。
JP2008504727A 2005-04-05 2006-03-16 量子化きざみを局所的に調整する方法 Expired - Fee Related JP5123168B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
FR0503369 2005-04-05
FR0503369 2005-04-05
PCT/EP2006/060804 WO2006106032A1 (en) 2005-04-05 2006-03-16 Method for locally adjusting a quantization step

Publications (2)

Publication Number Publication Date
JP2008535423A JP2008535423A (ja) 2008-08-28
JP5123168B2 true JP5123168B2 (ja) 2013-01-16

Family

ID=36299345

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008504727A Expired - Fee Related JP5123168B2 (ja) 2005-04-05 2006-03-16 量子化きざみを局所的に調整する方法

Country Status (6)

Country Link
US (1) US8139882B2 (ja)
EP (1) EP1867175B1 (ja)
JP (1) JP5123168B2 (ja)
KR (1) KR101194518B1 (ja)
CN (1) CN101156453B (ja)
WO (1) WO2006106032A1 (ja)

Families Citing this family (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8808195B2 (en) * 2009-01-15 2014-08-19 Po-He Tseng Eye-tracking method and system for screening human diseases
US9883180B2 (en) * 2012-10-03 2018-01-30 Avago Technologies General Ip (Singapore) Pte. Ltd. Bounded rate near-lossless and lossless image compression
US10812829B2 (en) 2012-10-03 2020-10-20 Avago Technologies International Sales Pte. Limited 2D block image encoding
US9813711B2 (en) 2012-10-03 2017-11-07 Avago Technologies General Ip (Singapore) Pte. Ltd. Hybrid transform-based compression
US9978156B2 (en) 2012-10-03 2018-05-22 Avago Technologies General Ip (Singapore) Pte. Ltd. High-throughput image and video compression
US9805442B2 (en) 2012-10-03 2017-10-31 Avago Technologies General Ip (Singapore) Pte. Ltd. Fine-grained bit-rate control
US9363517B2 (en) 2013-02-28 2016-06-07 Broadcom Corporation Indexed color history in image coding
US20140269901A1 (en) * 2013-03-13 2014-09-18 Magnum Semiconductor, Inc. Method and apparatus for perceptual macroblock quantization parameter decision to improve subjective visual quality of a video signal
GB201312382D0 (en) * 2013-07-10 2013-08-21 Microsoft Corp Region-of-interest aware video coding
US9386275B2 (en) 2014-01-06 2016-07-05 Intel IP Corporation Interactive video conferencing
US10979705B2 (en) * 2014-08-08 2021-04-13 Qualcomm Incorporated Method for video coding with spatial prediction mode for multi-mode video coding
US9516220B2 (en) 2014-10-02 2016-12-06 Intel Corporation Interactive video conferencing
US10021346B2 (en) 2014-12-05 2018-07-10 Intel IP Corporation Interactive video conferencing
EP3324628B1 (en) * 2016-11-18 2021-12-29 Axis AB Method and encoder system for encoding video
EP3328083A1 (en) * 2016-11-23 2018-05-30 Thomson Licensing Method and apparatus for encoding a video applying adaptive quantisation
JP6611748B2 (ja) * 2017-03-23 2019-11-27 Kddi株式会社 画質情報でセグメント受信を制御するクライアント、システム、プログラム及び方法

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20000005110A (ko) * 1996-03-29 2000-01-25 윌리암 제이. 버크 지각 메트릭을 이용하는 이미지 코딩시스템에서 엔코딩 최적화및 자동 조정가능 이미지 압축을 위한 장치 및 방법
JP4208315B2 (ja) * 1998-12-25 2009-01-14 キヤノン株式会社 データ通信制御装置及びその制御方法、データ通信システム、記録媒体
US6490319B1 (en) 1999-06-22 2002-12-03 Intel Corporation Region of interest video coding

Also Published As

Publication number Publication date
US8139882B2 (en) 2012-03-20
WO2006106032A1 (en) 2006-10-12
KR101194518B1 (ko) 2012-10-24
KR20080002808A (ko) 2008-01-04
JP2008535423A (ja) 2008-08-28
EP1867175A1 (en) 2007-12-19
CN101156453A (zh) 2008-04-02
US20090169125A1 (en) 2009-07-02
CN101156453B (zh) 2012-07-18
EP1867175B1 (en) 2012-08-15

Similar Documents

Publication Publication Date Title
JP5123168B2 (ja) 量子化きざみを局所的に調整する方法
CA2295689C (en) Apparatus and method for object based rate control in a coding system
US6654418B2 (en) Non-linear quantizer for video coding
US20160205403A1 (en) Method and Apparatus of Delta Quantization Parameter Processing for High Efficiency Video Coding
US6535555B1 (en) Quantizing method and device for video compression
US10027962B2 (en) System, method and computer-readable medium for encoding a signal into macroblocks
US20020129253A1 (en) Watermarking a compressed information signal
JP6568078B2 (ja) 画像データを符号化するための方法および装置ならびに画像データを復号するための方法および装置
JP5166435B2 (ja) 画像符号化方法及び係る方法を実現する装置
JPH08181992A (ja) 動画像符号化装置および領域抽出装置
CN1164167A (zh) 用于视频信号编码系统的自适应量化器
EP0914006A2 (en) System for perceptual compression and robust bit-rate control
JP5123166B2 (ja) 量子化きざみを局所的に調整する方法
KR100624404B1 (ko) 사람의 시각적 특성을 고려한 적응적 부호화 방법 및 장치
JP2004040811A (ja) 動映像符号化のためのdct演算量調節方法及びその装置
CN116982262A (zh) 视频编码中依赖性量化的状态转换
JP2017500814A (ja) 高ダイナミックレンジ画像を符号化するための方法およびデバイス
KR101737006B1 (ko) 인지 품질 기반의 변환 부호화 고속화 방법 및 장치
US7623720B2 (en) Image processing apparatus and method
JPH07236138A (ja) 動画像符号化装置
Sun et al. An efficient DCT-based image compression system based on transparent composite model
JPS63268387A (ja) 直交変換ベクトル、スカラ−混合量子化方式

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20090304

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120124

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20120406

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20120413

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120706

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20121009

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20121025

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20151102

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

Ref document number: 5123168

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R360 Written notification for declining of transfer of rights

Free format text: JAPANESE INTERMEDIATE CODE: R360

R360 Written notification for declining of transfer of rights

Free format text: JAPANESE INTERMEDIATE CODE: R360

R371 Transfer withdrawn

Free format text: JAPANESE INTERMEDIATE CODE: R371

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees