JP2009528738A - 画像信号エンコードにおいて画像中のピクセル・ブロックの諸グループについてビット割り当てを決定するための方法および装置 - Google Patents

画像信号エンコードにおいて画像中のピクセル・ブロックの諸グループについてビット割り当てを決定するための方法および装置 Download PDF

Info

Publication number
JP2009528738A
JP2009528738A JP2008556746A JP2008556746A JP2009528738A JP 2009528738 A JP2009528738 A JP 2009528738A JP 2008556746 A JP2008556746 A JP 2008556746A JP 2008556746 A JP2008556746 A JP 2008556746A JP 2009528738 A JP2009528738 A JP 2009528738A
Authority
JP
Japan
Prior art keywords
distortion
pixel blocks
gobi
gob
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2008556746A
Other languages
English (en)
Other versions
JP5015967B2 (ja
JP2009528738A5 (ja
Inventor
ボ チェン,ジ
ドン グ,シャオ
チン チェン,チュ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Thomson Licensing SAS
Original Assignee
Thomson Licensing SAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Thomson Licensing SAS filed Critical Thomson Licensing SAS
Publication of JP2009528738A publication Critical patent/JP2009528738A/ja
Publication of JP2009528738A5 publication Critical patent/JP2009528738A5/ja
Application granted granted Critical
Publication of JP5015967B2 publication Critical patent/JP5015967B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/189Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding
    • H04N19/192Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding the adaptation method, adaptation tool or adaptation type being iterative or recursive
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/147Data rate or code amount at the encoder output according to rate distortion criteria
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/149Data rate or code amount at the encoder output by estimating the code amount by means of a model, e.g. mathematical model or statistical model
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/189Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding
    • H04N19/19Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding using optimisation based on Lagrange multipliers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Algebra (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Pure & Applied Mathematics (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

最適化ビット割り当ては、符号化効率を上げるために、すなわち利用可能なデータレートの最適な利用のために、ビデオ圧縮における重要な問題である。人間の視覚系の観点では、人間は通例、画像の一部分に他の部分よりも多く注意を払う。したがって、ビット割り当ては、注目が異なる諸画像領域(GOBi)について最適化されるべきである。本発明のゆがみ駆動のビット割り当て方式は、符号化/復号誤差ゆがみを、人間の視覚系と整合するように画像領域に割り当て、ビットレートの制約条件も満足させる。本発明は、ゆがみ/ビットレート/ρ量子化パラメータのヒストグラム解析を使う。対応するテーブル(DGOBi[QPn]、RGOBi[QPn]およびρGOBi[QPn])に基づいて、注目が異なる諸領域について、量子化パラメータ、レート、ゆがみおよび0でない係数の割合の間の関係が決定される(PREALUTI、DISALL、RALL)。その後、ρ領域ビットレート制御が各マクロブロック・グループ内でのビット割り当てを計算するために使われる(RDBALL)。

Description

本発明は、画像信号エンコードにおいてピクセル・ブロックの諸グループについてのビット割り当てを決定するための方法および装置に関する。ここで、ピクセル・ブロックのこれらのグループは、画像中のピクセル・ブロックの対応する任意形状の領域の異なる注目重要さレベルに属する。
最適化ビット割り当て(optimised bit allocation)は、符号化効率を上げるために、すなわち利用可能なデータレートの最適な利用のために、ビデオ圧縮における重要な問題である。限られたビットレートに関して最良の知覚上の品質を達成することが最適化ビット割り当ての目標である。人間の視覚系の観点では、人間は通例、画像の一部分に他の部分よりも多く注意を払う。画像中で知覚的な敏感領域である「注目領域(attention area)」は、より人間の注目を捉える傾向がある。このことは、たとえばL. Itti, Ch. Koch, E. Nibur, "A Model of Saliency-Based Visual Attention for Rapid Scene Analysis", IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 20, No. 11, Nov. 1998に記載されている。したがって、注目が異なる画像領域の異なる知覚上の重要さに基づく最適なビット割り当ては、ビデオ圧縮技術における研究トピックとなっている。
たとえば、MPEG2およびMPEG4におけるマクロブロック層のビットレート制御は、現在フレームの全マクロブロックについて(変換後の)量子化きざみの大きさQstepの値を、それらのマクロブロックについて使われたビットの合計がフレーム目標ビットレートBに近くなるように選択する。MPEG2およびMPEG4はQstepについて31の異なる値をサポートする。MPEG4 AVCでは、合計52のQstepの値が規格によってサポートされており、これらは量子化パラメータ値QPによって指定される。
Ch. W. Tang, Ch. H. Chen, Y. H. Yu, Ch. J. Tsai, "A novel visual distortion sensitivity analysis for video encoder bit allocation", ICIP 2004, Volume 5, 24-27 Oct. 2004, pp .3225-3228は、視覚的なゆがみ感度、すなわち人間の視覚が動いている場面におけるゆがみを検出する能力についての記述を提案している。このときのビット割り当て方式は、公式:
QPN=QP+(1−VDSi,j/255)×Δq (1)
を使うことによって非常に単純であり、ここで、QPはレート制御によって割り当てられる初期量子化パラメータ、ΔqはQPの修正を制限するためのパラメータ、VDSi,jは画像中の(i,j)番目のマクロブロック(MBと記す)の視覚的なゆがみ感度値、QPNは洗練された量子化パラメータである。このビット割り当て方式は粗く、単純であり、精密なビットレート制御およびゆがみ分布制御を考慮に入れていない。
S. Sengupta, S. K. Gupta, J. M. Hannah, "Perceptually motivated bit-allocation for H.264 encoded video sequences", ICIP 2003では、画像が前景と背景に分割され、その際、前景品質については目標ゆがみ(target distortion)Dtarがあらかじめ決められており、背景品質については保証はない。背景の品質は前景からの距離の関数として変化する。劣化の割合は視覚的感度因子
S=e-d/a (2)
によって制御される。ここで、aは背景劣化の低下率を制御する定数であり、dはある背景ピクセルの、最も近い前景ピクセルからの距離である。この方式は、人間の視覚系と整合するゆがみ分布を与えようとするものであるが、その性能は使用されるモデルの精度の制約を受け、いかにしてDtarを取得し、所定のビット予算のもとで所与の式に従って品質劣化を保つかを説明しない。
ビット予算の制約のある最適化ビット割り当ての問題を解決するために、典型的なビット割り当てアルゴリズムは、ラグランジュ乗数処理を用いたレート‐ゆがみ最適化に基づく。これは、レートRがRT未満という制約を用いて総ゆがみDを最小化するという制約最適化問題として:
Figure 2009528738
のような表現を使って記述できる。ここで、DiおよびRiは各単位i(MBまたは注目領域)のゆがみ(distortion)およびビットレート(bit rate)である。
各MBのレートおよびゆがみが上で記述したようなエンコード・パラメータの選択のみに依存するとすると、式(3)の最適化は各MBのコストを別個に最小化すること:
min Ji:Ji=Di+λ×Ri (4)
に単純化できる。
各MBの符号化モード決定におけるラグランジュ乗数を公式:
λ′=α×λ (5)
に従って修正することに基づく最適化ビット割り当て方式を使うことが提案されている。ここで、αは知覚上の重要さの異なるレベルに従ってラグランジュ乗数を修正するためのスケーリング因子である。最適化ビット割り当てを実行するために異なる注目領域のゆがみに異なる重み付け因子Wiを加えることも提案されている:
Figure 2009528738
ここで、レートおよびひずみのモデルは:
Figure 2009528738
のようなρ領域のビットレート制御モデルに基づいて推定できる。式(7)を式(6)に代入してビット割り当てのための最適化された解を得ることができる。
式(8):
Figure 2009528738
に示されるようにガウス分布に基づくレート‐ゆがみモデルを使ってビット割り当てについての最適結果を得ることも知られている。
しかしながら、既知の方法は、ゆがみ分布を、人間の視覚系の性質により整合させるよう著しく影響することはできない。たとえば、異なる注目領域についてその人間の目に対する異なる重要さに従って異なる重み付け因子Wiを使うことは、本当にゆがみ分布にしかるべく影響することはできない。さらに、既知の方法は、よりよい性能を得るために十分(特にMBレベルで)精確ではない。
さらに、既知の方法は、ゆがみ分布とビット割り当て制約との間の良好な兼ね合いを保つのに問題がある。
本発明によって解決されるべき問題は、ビデオ信号エンコードにおけるビットレート制御のための改良されたゆがみ駆動のビット割り当てを提供することである。この問題は、請求項1で開示される方法によって解決される。この方法を使う装置は請求項2で開示される。
本発明のゆがみ駆動のビット割り当て方式は、符号化/復号誤差ゆがみを、人間の視覚系と整合するように画像領域に割り当て、ビットレートの制約条件も満足させる。「ゆがみ駆動の(distortion-driven)」とは、ビットレート制約条件のもとで、最適化された符号化/復号誤差ゆがみ分布を達成するビット割り当てを意味する。それにより、主たる目標は、総ゆがみを最小化することではない。本発明は、画像内のゆがみ分布を、人間の視覚の性質と、より整合するようにし、それにより限られたビットレートでずっとよい主観的な品質を達成するか、一貫した主観的品質を維持しながらビットレートを下げることを許容する。
本発明は、ゆがみ/ビットレート/ρ量子化パラメータのヒストグラム解析を使う。そのようなヒストグラム解析に基づいて、量子化パラメータ、レート、ゆがみおよび0でない係数の割合の間の関係が決定される。ゆがみ割り当て方式は、残差信号(モード決定およびイントラまたはインター予測後で、変換および量子化前の)のガウス分布を想定することに基づく。次いでρ領域(ρ-domain)ビットレート制御が各マクロブロック・グループ(GOB: group of macroblocks)内でのビット割り当てを計算するために使われる。
原理としては、本発明の方法は、変換および変換係数ブロックの量子化を含む画像信号エンコードにおいて、画像中のピクセル・ブロックの諸グループについてビット割り当てを決定するために好適である。ここで、前記画像はピクセル・ブロックの規則的なグリッドに分割され、ピクセル・ブロックの前記諸グループは、前記画像におけるピクセル・ブロックの対応する任意形状の領域の異なる注目重要さレベルに属する。ここで、ピクセル・ブロックの各グループのエンコード/デコードゆがみは、基本的にはピクセル・ブロックのそのグループについての注目重要さレベルに比例するように制御されることになる。ここで、ビット予算がエンコードされた画像について与えられ、前記量子化は量子化パラメータによって制御され、本方法は:
・現在画像について、前記量子化パラメータの諸候補に関し、ピクセル・ブロックの各グループについて、推定されるゆがみについておよびビットレートについてならびに前記量子化後の振幅が0の係数の数についてのテーブルまたはリストまたは関数を確立する段階と;
・ピクセル・ブロックの前記諸グループのそれぞれについて、推定されるゆがみについておよびビットレートについての前記テーブルまたはリストまたは関数を使って対応するゆがみ分布を計算し、次の段階からの出力も使って、前記ビット予算に達するために前記ゆがみ分布を修正する段階と、
・推定されるゆがみについておよびビットレートについての前記テーブルまたはリストまたは関数に基づいて、かつ前記計算されたゆがみ分布に基づいて、ピクセル・ブロックの前記諸グループのそれぞれについて推定されたビットレートを計算する段階と、
・ピクセル・ブロックの前記諸グループのそれぞれについて、前記推定されたビットレートおよび振幅が0の係数の数についての前記テーブルまたはリストまたは関数を使って、ρ領域ビット割り当てを実行し、ピクセル・ブロックを量子化およびエンコードするために前記量子化パラメータのうちの対応するものを決定する段階とを含む。
原理としては、本発明の装置は、変換および変換係数ブロックの量子化を含む画像信号エンコードにおいて、画像中のピクセル・ブロックの諸グループについてビット割り当てを決定するために好適である。ここで、前記画像はピクセル・ブロックの規則的なグリッドに分割され、ピクセル・ブロックの前記諸グループは、前記画像におけるピクセル・ブロックの対応する任意形状の領域の異なる注目重要さレベルに属する。ここで、ピクセル・ブロックの各グループのエンコード/デコードゆがみは、基本的にはピクセル・ブロックのそのグループについての注目重要さレベルに比例するように制御されることになる。ここで、ビット予算がエンコードされた画像について与えられ、前記量子化は量子化パラメータによって制御され、本装置は:
・現在画像について、前記量子化パラメータの諸候補に関し、ピクセル・ブロックの各グループについて、推定されるゆがみについておよびビットレートについてならびに前記量子化後の振幅が0の係数の数についてのテーブルまたはリストまたは関数を確立するよう適応された手段と;
・ピクセル・ブロックの前記諸グループのそれぞれについて、推定されるゆがみについておよびビットレートについての前記テーブルまたはリストまたは関数を使って対応するゆがみ分布を計算し、次の段階からの出力も使って、前記ビット予算に達するために前記ゆがみ分布を修正するよう適応された手段と、
・推定されるゆがみについておよびビットレートについての前記テーブルまたはリストまたは関数に基づいて、かつ前記計算されたゆがみ分布に基づいて、ピクセル・ブロックの前記諸グループのそれぞれについて推定されたビットレートを計算するよう適応された手段と、
・ピクセル・ブロックの前記諸グループのそれぞれについて、前記推定されたビットレートおよび振幅が0の係数の数についての前記テーブルまたはリストまたは関数を使って、ρ領域ビット割り当てを実行し、ピクセル・ブロックを量子化およびエンコードするために前記量子化パラメータのうちの対応するものを決定するよう適応された手段とを含む。
本発明のさらなる有利な実施形態はそれぞれの従属請求項において開示される。
本発明の例示的な実施形態について、付属の図面を参照して述べる。
上述したように、人間は画像の一部分にその画像の他の部分よりも多く注意を払う。人間のより多くの注目を受ける部分は「注目領域」と呼ばれる。L. Itti et al.からの上述の論文およびEP出願05300974.2では、所与の画像の視覚的な入力から一組のグレーレベル特徴マップが抽出される。これらの特徴は強度、色、配向などを含む。その際、各特徴マップにおいて、最も顕著な諸領域が拾い出される。最後に、すべての特徴マップが純粋にボトムアップの仕方でマスター「顕著性マップ(saliency map)」に統合され、このマスター顕著性マップが画像の注目情報と見なされる。そこから注目マスクが各画像について得られる。このマスクがその画像の対応する諸領域の異なる注目重要さレベルを記述する。
図1は、画像中のマクロブロックを注目重要さの四つのレベルMiのセット(i=1,...,4)に分割する例示的な注目マスクを示している。白いブロックにはレベルM4が割り当てられ、軽くハッチングされたブロックにはレベルM3が割り当てられ、強くハッチングされたブロックにはレベルM2が割り当てられ、斜めにハッチングされたブロックにはレベルM1が割り当てられている。Mi値が大きいほど視覚的な重要性が低い領域なので、より大きなゆがみが許容できることを意味する。たとえば、N=2、M1=1およびM2=2の場合、背景のゆがみレベル(レベル2)は前景のゆがみレベル(レベル1)の2倍であることができるということを意味する。
レベルの組および対応する視覚的重要さの値Miをどのように計算するかはここでは詳述しない。ビット割り当て方式は、Mi(i=1,...,N)について注目マスクが得られているという想定を基礎とすることができる。ここで、Nは注目レベルの数である。
基本的に、ゆがみ駆動のビット割り当て問題は次のように述べることができる:
注目マスクに基づけば、画像は、異なる注目またはマスク値Miに従ってN個のGOB(group of macroblocks[マクロブロック・グループ])に分割できる。各GOBiはKi個のマクロブロック(MBと記す)を含み、
Figure 2009528738
であり、ここでNMBは一画像中でのMBの総数である。任意のフレーム・レベルのビットレート制御から導出できるフレーム・ビット予算Rfでは、本発明の処理は、GOBi中の各MBについて、対応する注目マスク値Miに従ってゆがみ(バー付きのDi)を、これら二つの制約:
Figure 2009528738
によって割り当てる。ここで、バー付きのRiは各GOBiに割り当てられたビットレート、Duは各MBについての一定のゆがみ単位(distortion unit)である。式(9)は、各GOBiのゆがみは(基本的には)その注目マスク値に比例するということを意味しており、それならゆがみ分布は人間の知覚と整合するであろう。式(10)は、フレームまたは画像の全ビット予算Rfがこの場合に満たされているべきであることを意味している。したがって、本発明は、視覚的な注目解析に基づくゆがみ駆動のビット割り当て方式を提供する。結果として得られるゆがみおよびビットレートは式(9)および(10)の要請を満たすべきである。
図2では、本発明の内容に基づくゆがみ駆動のビット割り当て方式(CDBA)についてのフローチャートが描かれている。注目領域モデルを構築することについては、たとえば上述のL. Itti et al.の論文およびEP出願05300974.2など多くの研究業績が発表されいるので、注目マスクはすでに得られており、画像はN個のGOBに分割されており、フレーム・ビット予算Rfが任意のフレーム・レベルまたはフィールド・レベルのレート制御アルゴリズムから導出されていると想定する。次いで、ゆがみ駆動のビット割り当てを計算するために以下のステップが実行される。
ステップ1)事前解析および探索テーブル初期化(pre-analysis and look-up table initialisation)PREALUTI
現在処理されている画像について、各GOBi(i=1,...,N)について、ヒストグラム解析アルゴリズムに基づいて、各GOBについて、三つの探索テーブルまたはリストまたは関数DGOBi[QPn]、RGOBi[QPn]およびρGOBi[QPn]が決定される。ここで、QPnは候補量子化パラメータ、DGOBi[QPn]は推定されるゆがみ(単位はMB当たりの平均ゆがみ)、RGOBi[QPn]は量子化パラメータQPnのもとでの各GOBiのビットレート、ρGOBi[QPn]は量子化パラメータQPnを使った量子化後にGOBiの振幅が0の係数の数である。
ステップ2)ゆがみ割り当て(distortion allocation)DISALL
ステップ2.1)一定ビットレートのもとでゆがみ分布の推定(estimate distortion distribution under constant bit rate)ESTDDISTR
各GOBiがKi個のMBを含み、
Figure 2009528738
であり、ここでNMBは一画像中でのMBの総数である。このとき、定ビットレート(CBR: Constant Bit Rate)出力の場合(すなわち、異なる注目レベルの領域における異なるゆがみレベルを考えない)、各GOBiについての割り当てられるビットレートは、Ri=Rf×Ki/NMBであるべきである。したがって、各GOBiについての対応する初期ゆがみ値
Figure 2009528738
は、テーブルDGOBi[QPn]およびRGOBi[QPn]を探索する(look up)ことによって導出できる。このゆがみ値は、以下では、制約ビット予算とのゆがみ乗算値として使われる。
ステップ2.2)ゆがみ単位の計算(calculate distortion unit)CALLDU
残差信号の振幅(すなわち、変換された予測誤差信号)がガウス分布および対応するレートゆがみモデル(W. Lai, X. D. Gu, R. H. Wang, W. Y. Ma, H. J. Zhang, "A content-based bit allocation model for video streaming", ICME '04, 2004 IEEE International Conference on Multimedia and Expo, Volume 2, 27-30 June 2004, pp. 1315-1318参照)をもつとの想定に基づき、ゆがみ単位Duを得るために次の公式:
Figure 2009528738
を使うことができる。
ステップ2.3)洗練されたゆがみ分布を取得(get the refined distortion distribution)GREFDDIRTR
GOBi中の各MBについての割り当てられるゆがみ(バー付きのDi)を、公式(9):
Figure 2009528738
を使うことによって得る。ガウス分布という想定の不正確さのため、所与のビット予算に達するためにステップ3)からのフィードバックに基づいて小規模な修正が実行されることができる。
各量子化パラメータのもとでのゆがみまたはビットレートは離散的であるはずで、厳密なゆがみ値を上記の公式(9)のもとで達成することはできないので、事前解析ステップ1)で生成された探索テーブルを使うことができ、ゆがみの値(バー付きのDi)は、そのゆがみ探索テーブルにおいてDu×Miの推定された値に最も近くなるよう適応される。
ステップ3)からのフィードバックに関し、ステップ3)における推定されたビットレート(バー付きのRi)がビット予算より大きいまたは小さい場合は、所与のビット予算に達するために、ステップ2)において、探索テーブルにおける近接値(Du×Miに近い)をチェックすることによって、何らかの修正が実行されることができる。
ステップ3)ビットレート割り当て(bit rate allocation)RALL
DGOBi[QPn]およびRGOBi[QPn]のテーブルならびにステップ2)からの
Figure 2009528738
に基づいて、各GOBiについて(i=1,...,N)、推定されるレート
Figure 2009528738
は直接的に得ることができる。そして推定される結果は、ビット予算に達するために割り当てられるレートに対する何らかの小規模な訂正を行うために、ステップ2.3)にフィードバックされる。
ステップ4)各GOBi内でのρ領域ビット割り当て(Rho-domain bit allocation inside each GOBi)RDBALL
ステップ4.1)量子化パラメータ決定(quantisation parameter determination)QPDET
Z. He and S. K. Mitra, "A linear source model and a unified rate control algorithm for DCT video coding", IEEE Transactions on Circuits and Systems for Video Technology, Vol. 12, No. 11, Nov. 2002, pp. 970-982におけるρ領域レート制御モデルと同様に、GOBi内の残っているMBを量子化することによって生成されるべき0の数は:
Figure 2009528738
となるべきである。ここで、Ni cは現在の画像中のGOBiの符号化されたMBの数、Ri cはこれらのNi c個のMBをエンコードするために使われるビット数、KiはGOBiのMBの総数である。
テーブルρGOBi[QPn]を探索して、量子化パラメータQPが決定される。次いで、現在のMBがそのQP値を使って量子化され、エンコードされる。
ステップ4.2)パラメータを更新(update parameters)UPDPAR
すでにエンコードされたMBに従ってパラメータθおよびρGOBi[QPn]の更新:
Figure 2009528738
ここで、ρi cはこれらの符号化されたNi c個のMBにおける量子化された0の係数の数である。その後、次のマクロブロックがエンコードされる。
以下では、ステップ1)ないし4)についての追加的な説明を与える。
ステップ1)事前解析および探索テーブル初期化
S. H. Hong, S. D. Kim, "Histogram-based rate-distortion estimation for MPEG-2 video", IEE Proceedings Vision, Image Signal Processing, Vol. 146, No. 4, Aug. 1999, pp. 198-205によって提案されたアルゴリズムに基づいて、ISO/IEC14496-10 AVC/H.264規格のためのヒストグラムに基づくレート‐ゆがみ推定が実行される。基本的な想定は:平均平方誤差(MSE: mean squared error)で表したゆがみは適用される量子化パラメータの二乗に比例するということと、既存のビデオ符号化規格では通常、一様な量子化が使用されるということである。このとき、逐次反復アルゴリズムを使って、D(QPn)=D(QPn-1)+ΔD(QPn-1,QPn)に従って種々の量子化パラメータのゆがみを推定できる。ここで、ΔD(QPn-1,QPn)は、量子化パラメータがQPn-1からQPnに増加するときのゆがみの増分である。
その後、DCT係数の大きさ(magnitude)および関係するQPに基づいたヒストグラムまたはリストHist1→0[QPn]が現在のGOB(マクロブロック・グループ)について確立される。このヒストグラムは、QPnを適用するときには振幅量「1」に量子化されるが、次の量子化パラメータQPn+1を適用するときは振幅「0」に量子化されるDCT係数の数を表現する。
上記のヒストグラムまたはリストHist1→0[QPn]に基づいて、H.264/AVCについて、各量子化パラメータのもとでの0でない(non-zero)大きさの係数の数の探索テーブルを、公式
Figure 2009528738
によって簡単に確立できる。ここで、Ncoeffは、各単位(本発明ではGOB)における係数の総数である。
各量子化パラメータQPnには対応する量子化きざみ(quantisation step)QPSnが属しており、これはたとえばH.264/AVC規格における対応する探索テーブルから導出できる。
二つの相続くQP値の間のゆがみ増分ΔD(QPn-1,QPn)を精確に推定するために、三つの場合が考慮される:
場合1)量子化された係数がQPnで0でない;
場合2)量子化された係数がQPn-1では0でないが、QPnでは0に量子化される;
場合3)量子化された係数がQPn-1で0。
場合1)については、ゆがみ増分は下記の公式を使って推定できる。残差信号が量子化レベル・ギャップ内に一様に分布しているとの想定に基づき:
Figure 2009528738
ここで、UD(QPn)は、一様分布の想定が存在する場合1)においてQPnによって導入されるゆがみであり、ΔE1(QPn)は、場合1)におけるQPn-1からQPnへのゆがみの増加を表す。
場合2)については、ゆがみ増分は下記の公式:
Figure 2009528738
を使って推定できる。
場合3)については、ゆがみ増分はない。
H.264/AVCでは、δnはイントラ16×16モードで使われるDC変換の場合、2×QPSn/3であり、イントラ符号化のその他の場合にはδn=QPSn/3が使われ、インター符号化の場合にはδn=QPSn/6が使われる。このとき、最終的なゆがみ増分は
ΔDe(QPn-1,QPn)=ΔE1(QPn)+ΔE2(QPn)
となる。
逐次反復的なゆがみ推定方法の初期値は
Figure 2009528738
である。すると、QPゆがみテーブルDGOBi[QPn]が確立できる。
上記のZ. He and S. K. Mitraの論文から知られるように0でない振幅の係数の数は符号化されるビットの数に比例するので、線形モデルは非常によく当てはまる。したがって、確立されたリストNZCに基づいてビットレートを推定するために、線形モデルが使われる。
0でない係数の数が0であるときに符号化されるビットの数が0になると想定すると、対応する補間線は、線上の少なくとも二点が与えられれば固定できる。一つの基準点(reference point)QPはQPrefに設定され、次いで符号化されるビットの真の(real)数Rbitsは、種々の複雑さおよび精確さの要請に従ってエントロピー符号化によってまたは周波数解析を通じて推定する(たとえば、Q. Chen, Y. He, "A Fast Bits Estimation Method for Rate-Distortion Optimisation in H.264/AVC", Picture Coding Symposium, 15-17 December 2004, San Francisco, CA, USAに従って)ことによって決定される。この線形モデルを探索テーブルNZC[QPn]と組み合わせれば、QP‐レート・テーブルRGOBi[QPn]は次の公式によって構築できる。
Figure 2009528738
次いで、0でないリストまたはテーブルNZC[QPn]に基づいて、次の公式:
Figure 2009528738
を使ってQP‐ρテーブルρGOBi[QPn]を簡単に取得できる。
ステップ2)ゆがみ割り当て
残差信号のガウス分布の想定に基づき、最適ビット割り当てにおいて式(8)のような単純化されたレート‐ゆがみモデルが使われてきた。式(8)および(10)に基づいて、一つの基本的な結論:
Figure 2009528738
に到達できる。
したがって、各GOBのゆがみの乗算結果は、所与のビット予算Rfでは一定に保たれるべきである。ステップ2.1)で述べたように、CBRの場合における各GOBi
Figure 2009528738
は、テーブルDGOBi[QPn]およびRGOBi[QPn]を探索することによって簡単に導出でき、そのとき、式(14)および(9)に基づいて、
Figure 2009528738
となる。
Figure 2009528738
とすれば式(15)から式(11)を導くことができる。
画像内でコンテンツ属性に差があり、量子化レベルが離散的な値の有限の集合によって限定されているため式(8)は常に精確ではないので、ビット予算に達するために、ステップ3)からのフィードバックに基づいて何らかの小規模な修正がなされることができる。式(11)からの結果は、探索テーブルを使って最適化されたゆがみ割り当てを検索するための、常に良好な出発点となるべきである。
ステップ3)レート割り当て
このステップの結果は、ビット割り当てを洗練させるためにステップ2.3)にフィードバックされる。
ステップ4)各GOBi内でのビット割り当て
このステップは、ビット予算制約を精密に満たすために使われる。通例、ステップ3)でビット予算がすでに満たされていれば、探索テーブルRGOBi[QPn]から導出された対応する量子化パラメータを各GOBについて直接使用できる。しかしながら、(たとえばH.264/AVCにおいて)実際の符号化における量子化パラメータおよび符号化モードが事前解析プロセスにおけるものから異なっている場合、ビット予算を満たすためには更新のある精密なビット割り当てが必要とされる。したがって、ρ領域レート制御が、限られたビット予算をもってゆがみを分散させるための各GOB内での洗練されたビット割り当て方式として使われる。
フレーム・ベースではなく、本発明はインターレース式ビデオ信号についてフィールド・ベースの仕方で実行されることもできる。本発明はまた、マルチパス・レート制御ビデオ符号化(multi-pass rate control video coding)においておよび誤り回復性ビデオ符号化(error resilience video coding)においても使用されることができる。
例示的な注目マスクを示す図である。 本発明の内容に基づくゆがみ駆動のビット割り当て(CDBA: content based distortion driven bit allocation)方式のためのフローチャートである。

Claims (9)

  1. 変換および変換係数ブロックの量子化を含む画像信号エンコードにおいて、画像中のピクセル・ブロックの諸グループ(GOBi)についてビット割り当てを決定(RALL、RDBALL)する方法であって、前記画像はピクセル・ブロックの規則的なグリッドに分割され、ピクセル・ブロックの前記諸グループ(GOBi)は、前記画像におけるピクセル・ブロックの対応する任意形状の領域の異なる注目重要さレベル(Mi)に属し、ピクセル・ブロックの各グループのエンコード/デコードゆがみは、基本的にはピクセル・ブロックのそのグループについての注目重要さレベルに比例するように制御され、ビット予算(Rf)がエンコードされた画像について与えられ、前記量子化は量子化パラメータ(QP)によって制御され、本方法は:
    ・現在画像について、前記量子化パラメータ(QP)の諸候補に関し、ピクセル・ブロックの各グループ(GOBi)について、推定されるゆがみについて(DGOBi[QPn])およびビットレートについてRGOBi[QPn]、ならびに前記量子化後の振幅が0の係数の数についてρGOBi[QPn]、のテーブルまたはリストまたは関数を確立する段階と;
    ・ピクセル・ブロックの前記諸グループのそれぞれ(GOBi)について、推定されるゆがみについて(DGOBi[QPn])およびビットレートについて(RGOBi[QPn])の前記テーブルまたはリストまたは関数を使って対応するゆがみ分布
    (外1)
    Figure 2009528738
    を計算し、次の段階からの出力も使って、前記ビット予算(Rf)に達するために前記ゆがみ分布を修正する段階と、
    ・推定されるゆがみについて(DGOBi[QPn])およびビットレートについて(RGOBi[QPn])の前記テーブルまたはリストまたは関数に基づいて、かつ前記計算されたゆがみ分布に基づいて、ピクセル・ブロックの前記諸グループのそれぞれ(GOBi)について推定されたビットレート
    (外2)
    Figure 2009528738
    を計算する段階と、
    ・ピクセル・ブロックの前記諸グループのそれぞれ(GOBi)について、前記推定されたビットレートおよび振幅が0の係数の数についての前記テーブルまたはリストまたは関数(ρGOBi[QPn])を使って、ρ領域ビット割り当てを実行し、ピクセル・ブロックを量子化およびエンコードするために前記量子化パラメータ(QP)のうちの対応するものを決定する段階とを含む、
    ことを特徴とする方法。
  2. 変換および変換係数ブロックの量子化を含む画像信号エンコードにおいて、画像中のピクセル・ブロックの諸グループ(GOBi)についてビット割り当てを決定(RALL、RDBALL)する装置であって、前記画像はピクセル・ブロックの規則的なグリッドに分割され、ピクセル・ブロックの前記諸グループ(GOBi)は、前記画像におけるピクセル・ブロックの対応する任意形状の領域の異なる注目重要さレベル(Mi)に属し、ピクセル・ブロックの各グループのエンコード/デコードゆがみは、基本的にはピクセル・ブロックのそのグループについての注目重要さレベルに比例するように制御され、ビット予算(Rf)がエンコードされた画像について与えられ、前記量子化は量子化パラメータ(QP)によって制御され、本装置は:
    ・現在画像について、前記量子化パラメータ(QP)の諸候補に関し、ピクセル・ブロックの各グループ(GOBi)について、推定されるゆがみについて(DGOBi[QPn])およびビットレートについてRGOBi[QPn]、ならびに前記量子化後の振幅が0の係数の数についてρGOBi[QPn]、のテーブルまたはリストまたは関数を確立するよう適応された手段(PREALUTI)と;
    ・ピクセル・ブロックの前記諸グループのそれぞれ(GOBi)について、推定されるゆがみについて(DGOBi[QPn])およびビットレートについて(RGOBi[QPn])の前記テーブルまたはリストまたは関数を使って対応するゆがみ分布
    (外3)
    Figure 2009528738
    を計算し、次の段階からの出力も使って、前記ビット予算(Rf)に達するために前記ゆがみ分布を修正するよう適応された手段(DISALL)と、
    ・推定されるゆがみについて(DGOBi[QPn])およびビットレートについて(RGOBi[QPn])の前記テーブルまたはリストまたは関数に基づいて、かつ前記計算されたゆがみ分布に基づいて、ピクセル・ブロックの前記諸グループのそれぞれ(GOBi)について推定されたビットレート
    (外4)
    Figure 2009528738
    を計算するよう適応された手段(RALL)と、
    ・ピクセル・ブロックの前記諸グループのそれぞれ(GOBi)について、前記推定されたビットレートおよび振幅が0の係数の数についての前記テーブルまたはリストまたは関数(ρGOBi[QPn])を使って、ρ領域ビット割り当てを実行し、ピクセル・ブロックを量子化およびエンコードするために前記量子化パラメータ(QP)のうちの対応するものを決定するよう適応された手段(RDBALL)
    とを含む、
    装置。
  3. 前記ピクセル・ブロックがマクロブロックである、請求項1記載の方法または請求項2記載の装置。
  4. 前記エンコードされた画像がISO/IEC 14496-10 AVCでエンコードされた画像シーケンスの一部である、請求項1もしくは3記載の方法または請求項2もしくは3記載の装置。
  5. 前記量子化パラメータ(QP)が量子化器のきざみの大きさ(step size)である、請求項1、3および4のうちいずれか一項記載の方法または請求項3ないし5のうちいずれか一項記載の装置。
  6. ピクセル・ブロックの前記諸グループのそれぞれ(GOBi)について対応するゆがみ分布を計算する前記段階または機能は:
    ・異なる注目レベル領域における異なるゆがみレベルを顧慮することなく、ピクセル・ブロックの各グループ(GOBi)について対応する初期ゆがみ値
    (外5)
    Figure 2009528738
    を計算することと;
    ・ゆがみ単位
    Figure 2009528738
    を計算し、ここで、Miはピクセル・ブロックの対応するグループ(GOBi)についての注目重要さレベルで、Kiはピクセル・ブロックの対応するグループ(GOBi)におけるピクセル・ブロックの数であり、Nは注目レベルの数である、ことと;
    ・ピクセル・ブロックの前記諸グループのそれぞれ(GOBi)について、前記のDuの値から
    Figure 2009528738
    によって洗練されたゆがみ分布を計算し、それにより前記ゆがみ分布を修正する前記段階がここで行われることとを含む、
    請求項1および3ないし5のうちいずれか一項記載の方法または請求項2ないし5のうちいずれか一項記載の装置。
  7. ピクセル・ブロックの前記諸グループのそれぞれ(GOBi)についてρ領域ビット割り当てを実行する段階または機能が:
    Figure 2009528738
    を計算し、ここで、Ni cはピクセル・ブロックの現在のグループの符号化されたピクセル・ブロックの数、Ri cはこれらのNi c個のピクセル・ブロックをエンコードするために使われるビット数、Kiはピクセル・ブロックの現在のグループのピクセル・ブロックの総数である、ことと;
    ・前記量子化後の振幅が0の係数の数についての前記テーブルまたはリストまたは関数(ρGOBi[QPn])から、対応する量子化パラメータ(QP)を決定することと;
    ・振幅が0の係数の数についての前記テーブルまたはリストまたは関数(ρGOBi[QPn])およびパラメータθを、すでにエンコードされたピクセル・ブロックに基づいて
    Figure 2009528738
    によって更新し、ここで、ρi cは前記符号化されたNi c個のピクセル・ブロックにおける量子化された0の係数の数である、こととを含む、
    請求項1および3ないし6のうちいずれか一項記載の方法または請求項2ないし6のうちいずれか一項記載の装置。
  8. 請求項1および3ないし7のうちいずれか一項記載の方法を使ってエンコードされたデジタル・ビデオ信号。
  9. 請求項1および3ないし7のうちいずれか一項記載の方法に基づいてエンコードされたデジタル・ビデオ信号を含むまたは記憶するまたは記録している光ディスクなどの記憶媒体。
JP2008556746A 2006-03-02 2007-02-16 画像信号エンコードにおいて画像中のピクセル・ブロックの諸グループについてビット割り当てを決定するための方法および装置 Expired - Fee Related JP5015967B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP06300184.6 2006-03-02
EP06300184A EP1830573A1 (en) 2006-03-02 2006-03-02 Method and apparatus for determining in picture signal encoding the bit allocation for groups of pixel blocks in a picture
PCT/EP2007/051500 WO2007099039A1 (en) 2006-03-02 2007-02-16 Method and apparatus for determining in picture signal encoding the bit allocation for groups of pixel blocks in a picture

Publications (3)

Publication Number Publication Date
JP2009528738A true JP2009528738A (ja) 2009-08-06
JP2009528738A5 JP2009528738A5 (ja) 2010-03-11
JP5015967B2 JP5015967B2 (ja) 2012-09-05

Family

ID=36693922

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008556746A Expired - Fee Related JP5015967B2 (ja) 2006-03-02 2007-02-16 画像信号エンコードにおいて画像中のピクセル・ブロックの諸グループについてビット割り当てを決定するための方法および装置

Country Status (6)

Country Link
US (1) US8179981B2 (ja)
EP (2) EP1830573A1 (ja)
JP (1) JP5015967B2 (ja)
KR (1) KR101277363B1 (ja)
CN (1) CN101395923B (ja)
WO (1) WO2007099039A1 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011176483A (ja) * 2010-02-23 2011-09-08 Oki Electric Industry Co Ltd 量子化装置、プログラム及び方法、並びに、動画像符号化装置
JP2013532439A (ja) * 2010-06-17 2013-08-15 マイクロソフト コーポレーション 変換係数ヒストグラムに基づくビデオレート制御

Families Citing this family (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008128380A1 (en) * 2007-04-20 2008-10-30 Thomson Licensing Method and apparatus for selecting a scan path for the elements of a block in spatial domain picture encoding and decoding
US9979972B2 (en) 2007-10-05 2018-05-22 Thomson Licensing Dtv Method and apparatus for rate control accuracy in video encoding and decoding
WO2009157827A1 (en) * 2008-06-25 2009-12-30 Telefonaktiebolaget L M Ericsson (Publ) Row evaluation rate control
TWI405467B (zh) * 2009-11-25 2013-08-11 Novatek Microelectronics Corp 影像壓縮的位元速率控制電路與方法
WO2012027892A1 (en) * 2010-09-02 2012-03-08 Intersil Americas Inc. Rho-domain metrics
US8902973B2 (en) * 2011-04-05 2014-12-02 Dialogic Corporation Perceptual processing techniques for video transcoding
EP2575364B1 (en) * 2011-09-30 2020-03-18 BlackBerry Limited Methods and devices for data compression using a non-uniform reconstruction space
US9094681B1 (en) * 2012-02-28 2015-07-28 Google Inc. Adaptive segmentation
CN104322063B (zh) 2012-07-27 2018-11-02 惠普发展公司,有限责任合伙企业 视频流压缩的方法、系统和计算机可读存储介质
US9280540B2 (en) 2012-10-01 2016-03-08 Verizon Patent And Licensing Inc. Content-driven download speed
CN104427291B (zh) * 2013-08-19 2018-09-28 华为技术有限公司 一种图像处理方法及设备
KR101603268B1 (ko) * 2014-01-23 2016-03-14 삼성전자주식회사 영상 데이터 처리 방법 및 디바이스
US10091504B2 (en) 2015-01-08 2018-10-02 Microsoft Technology Licensing, Llc Variations of rho-domain rate control
US10812550B1 (en) 2016-08-03 2020-10-20 Amazon Technologies, Inc. Bitrate allocation for a multichannel media stream
CN109246431B (zh) * 2017-07-10 2021-06-04 北京君正集成电路股份有限公司 一种基于量化参数配置的视频编码方法、装置和电子设备
CN111164972A (zh) 2017-11-30 2020-05-15 深圳市大疆创新科技有限公司 用于在帧级别控制视频编码的系统和方法
CN110832856A (zh) 2017-11-30 2020-02-21 深圳市大疆创新科技有限公司 用于减小视频编码波动的系统及方法
WO2019104611A1 (en) * 2017-11-30 2019-06-06 SZ DJI Technology Co., Ltd. System and method for controlling video coding within image frame
CN111492657B (zh) * 2017-12-08 2023-06-30 上海科技大学 基于脸部区域检测的光场视频压缩
US11750811B2 (en) * 2018-04-06 2023-09-05 Comcast Cable Communications, Llc Systems, methods, and apparatuses for processing video
CN112655212B (zh) * 2018-11-28 2023-04-04 Oppo广东移动通信有限公司 视频编码优化方法、装置及计算机存储介质
CN110602495A (zh) * 2019-08-20 2019-12-20 深圳市盛世生物医疗科技有限公司 一种医学图像编码方法及装置

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003174648A (ja) * 2001-12-04 2003-06-20 Kddi Research & Development Laboratories Inc 動画像符号化装置
JP2004015340A (ja) * 2002-06-05 2004-01-15 Kddi R & D Laboratories Inc 動画像符号化のための量子化制御方式
JP2004531950A (ja) * 2001-04-27 2004-10-14 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ ビデオ符号化に対する歪量子化器モデル

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6067118A (en) * 1997-12-16 2000-05-23 Philips Electronics North America Corp. Method of frame-by-frame calculation of quantization matrices
SE521021C2 (sv) * 1998-06-18 2003-09-23 Ericsson Telefon Ab L M Förfarande och anordning vid överförande av bilder
US6904091B1 (en) * 1999-03-25 2005-06-07 Imec Vzw Methods and apparatus for progressive transmission of subband images
US20020122482A1 (en) * 2001-01-03 2002-09-05 Kim Hyun Mun Method of performing video encoding rate control using bit budget
KR100440953B1 (ko) * 2001-08-18 2004-07-21 삼성전자주식회사 영상 압축 비트 스트림의 트랜스코딩 방법
KR100468726B1 (ko) * 2002-04-18 2005-01-29 삼성전자주식회사 실시간 가변 비트율 제어를 수행하는 부호화 장치 및 방법
CN1206864C (zh) * 2002-07-22 2005-06-15 中国科学院计算技术研究所 结合率失真优化的码率控制的方法及其装置
KR100505699B1 (ko) * 2003-08-12 2005-08-03 삼성전자주식회사 실시간 가변 비트율 제어로 화질을 개선시키는 비디오인코더의 인코딩율 제어기, 이를 구비한 비디오 데이터전송 시스템 및 그 방법
US8224102B2 (en) * 2005-04-08 2012-07-17 Agency For Science, Technology And Research Method for encoding a picture, computer program product and encoder
US8019170B2 (en) * 2005-10-05 2011-09-13 Qualcomm, Incorporated Video frame motion-based automatic region-of-interest detection

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004531950A (ja) * 2001-04-27 2004-10-14 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ ビデオ符号化に対する歪量子化器モデル
JP2003174648A (ja) * 2001-12-04 2003-06-20 Kddi Research & Development Laboratories Inc 動画像符号化装置
JP2004015340A (ja) * 2002-06-05 2004-01-15 Kddi R & D Laboratories Inc 動画像符号化のための量子化制御方式

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011176483A (ja) * 2010-02-23 2011-09-08 Oki Electric Industry Co Ltd 量子化装置、プログラム及び方法、並びに、動画像符号化装置
JP2013532439A (ja) * 2010-06-17 2013-08-15 マイクロソフト コーポレーション 変換係数ヒストグラムに基づくビデオレート制御

Also Published As

Publication number Publication date
KR101277363B1 (ko) 2013-06-20
JP5015967B2 (ja) 2012-09-05
CN101395923B (zh) 2011-06-15
US8179981B2 (en) 2012-05-15
KR20080114706A (ko) 2008-12-31
US20100183069A1 (en) 2010-07-22
EP1994758B1 (en) 2012-05-23
WO2007099039A1 (en) 2007-09-07
EP1994758A1 (en) 2008-11-26
CN101395923A (zh) 2009-03-25
EP1830573A1 (en) 2007-09-05

Similar Documents

Publication Publication Date Title
JP5015967B2 (ja) 画像信号エンコードにおいて画像中のピクセル・ブロックの諸グループについてビット割り当てを決定するための方法および装置
EP1372113B1 (en) Variable bit rate video encoding method and device
US8559501B2 (en) Method and apparatus for adaptively determining a bit budget for encoding video pictures
KR101518358B1 (ko) 비디오 코딩에서 프레임 복잡성, 버퍼 레벨 및 인트라 프레임들의 위치를 이용하는 버퍼 기반의 비율 제어
EP1074148B1 (en) Moving pictures encoding with constant overall bit rate
US9516328B2 (en) Method and apparatus for rate control accuracy in video encoding
US20100111180A1 (en) Scene change detection
US20200068200A1 (en) Methods and apparatuses for encoding and decoding video based on perceptual metric classification
Zhou et al. Improvement on rate-distortion performance of H. 264 rate control in low bit rate
Jing et al. A novel intra-rate estimation method for H. 264 rate control
Wu et al. A content-adaptive distortion–quantization model for H. 264/AVC and its applications
Lee et al. A VBR video encoding for locally consistent picture quality with small buffering delay under limited bandwidth
Lee et al. A rate control algorithm for DCT-based video coding using simple rate estimation and linear source model
Li et al. An improved ROI-based rate control algorithm for H. 264/AVC
Yin et al. A practical consistent-quality two-pass VBR video coding algorithm for digital storage application
Wang et al. MPEG motion picture coding with long-term constraint on distortion variation
Pai et al. MPEG-4 constant-quality constant-bit-rate control algorithms
Wu et al. A content-adaptive distortion-quantization model for intra coding in H. 264/AVC
KR101868270B1 (ko) 싱글 패스 일관 화질 제어를 기반으로 하는 컨텐츠 인식 비디오 인코딩 방법, 컨트롤러 및 시스템
Sun et al. A novel incremental rate control scheme for H. 264 video coding
JP2021118404A (ja) 撮像装置及びその制御方法及びプログラム
Liu Fast and adaptive H. 264/AVC video coding for network based applications
Fang et al. Adaptive Rate Control Mechanism in H. 264/AVC for Scene Changes
Lee Efficient single-pass rate control for video coding based on motion estimation statistics
Chen An intra-rate estimation method for H. 264 rate control

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100125

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20100125

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20120208

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120214

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120424

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120522

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120607

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150615

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 5015967

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees