JP2007522742A - 非線形量子化に基づくビデオ画像の符号化及び復号化 - Google Patents
非線形量子化に基づくビデオ画像の符号化及び復号化 Download PDFInfo
- Publication number
- JP2007522742A JP2007522742A JP2006552469A JP2006552469A JP2007522742A JP 2007522742 A JP2007522742 A JP 2007522742A JP 2006552469 A JP2006552469 A JP 2006552469A JP 2006552469 A JP2006552469 A JP 2006552469A JP 2007522742 A JP2007522742 A JP 2007522742A
- Authority
- JP
- Japan
- Prior art keywords
- quantization
- curve
- coefficient value
- interval
- video data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/124—Quantisation
- H04N19/126—Details of normalisation or weighting functions, e.g. normalisation matrices or variable uniform quantisers
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/60—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
- H04N19/61—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
本発明は、発生するビットレートを増やさず符号化効率を維持しながら量子化処理をフィルム粒子情報によりよく適合させるために、ビデオデータを符号化するための量子化区間を状況に応じて変形できるようにする。
Description
本発明は、動画ビデオデータの符号化及び復号化に関する。特に、本発明は、適応量子化を用いることで、ビデオデータを、フィルム粒子情報を含めて符号化及び復号化する方法及び装置に関する。
動画フィルムはフィルムの写真乳剤中に分散するハロゲン化銀結晶から成る。写真フィルムに記録される各画像は、ハロゲン化銀結晶を感光させ現像することによって生成される。発色像において、銀は現像後に化学的に除去されている。しかしながら、銀結晶の構造は、現像後にも小さな着色粒子の形で残る。乳剤中の銀結晶の形状はランダムであるために、粒子は画像中にランダムに形成され分布する。粒子構造の図示例が、図1に示されている。知覚可能な粒子構造は、フィルム粒子と呼ばれる。
動画の再生を見ている視聴者は、大きさが0.002ミリメートルからその10分の1を超える個々の粒子を知覚することはない。しかしながら、視聴者は、粒子群を知覚してそれをフィルム粒子だと識別する。
画像の解像度を高めると、フィルム粒子が知覚される度合いもそれだけ高くなる。フィルム粒子は、特に、映画館での上映や高解像度ビデオ映像の中ではっきりと知覚される。他方、標準テレビ画像や、より小さなテレビ表示フォーマットでは、フィルム粒子はそれほど重要ではない。
動画は、テレビ電話やテレビ会議からDVD及びデジタルテレビジョンに至るまで、ますます多くのアプリケーションで用いられている。動画を伝送し、また記録するときには、利用可能な周波数帯域が限られている従来の送信チャネルを通してかなりの量のデータを送り、またデータ容量が限られている従来の記憶媒体に蓄積しなくてはならない。従来のチャネル及び媒体でデジタルデータを伝送し蓄積するためには、デジタルデータの圧縮又は減量が不可避である。
ビデオデータの圧縮のために、複数のビデオ符号化規格が開発されている。そのようなビデオ規格は、例えば、H.26xと称されるITU−Tの規格であり、またMPEG−xと称されるISO/IECの規格である。現在、最新かつ先進のビデオ符号化規格は、H.264/AVC又はMPEG4/AVCと称される規格である。
これらの規格の基礎となっているほとんどの符号化方法は、次の主要な段階から成る。
(a)各ビデオフレームをブロックレベルでデータ圧縮するために、個々のフレームを画素のブロックに分割する。
(b)ビデオデータの各ブロックを空間領域から時間領域へ変換することにより、ビデオフレーム内で空間的な冗長性を減らす。
(c)その結果である変換係数を量子化する。
(d)量子化された変換係数をエントロピー符号化する。
(e)続くフレーム間の変化のみを伝送するために、続くフレームのブロック間の時間的な依存性を利用する。これは、動き推定及び補償技術を用いて実現される。
(a)各ビデオフレームをブロックレベルでデータ圧縮するために、個々のフレームを画素のブロックに分割する。
(b)ビデオデータの各ブロックを空間領域から時間領域へ変換することにより、ビデオフレーム内で空間的な冗長性を減らす。
(c)その結果である変換係数を量子化する。
(d)量子化された変換係数をエントロピー符号化する。
(e)続くフレーム間の変化のみを伝送するために、続くフレームのブロック間の時間的な依存性を利用する。これは、動き推定及び補償技術を用いて実現される。
様々なビデオ圧縮技術の中で、いわゆるハイブリッド符号化技術が最も効果的であると知られている。このハイブリッド符号化技術では、時間及び空間圧縮技術に統計的な符号化を組み合わせる。ほとんどのハイブリッド技術は、動き補償された差分パルス符号変調(DPCM)、二次元離散コサイン変換(DCT)、DCT係数の量子化、及び可変長符号化(VLC)を用いる。
動き補償されたDPCMとは、対象フレームと先行フレームとの間での画像オブジェクトの動きを特定し、特定された動きに従って対象フレームを予測して、対象フレームとその予測との差分を表す差分信号を生成する処理である。
現行のビデオ符号化規格は、異なるビデオコンテンツに対処するために、複数の異なる処理手順を用いるものの、これらの規格はフィルム粒子を考慮に入れていない。そのため、これらの規格はフィルム粒子情報を符号化しない。フィルム粒子情報を残すには、符号化効率をかなり下げるしかない。
そこで、本発明は、ビデオデータを、符号化効率を落とさずに、フィルム粒子情報を含めて符号化及び復号化する改良された方法及び装置を提供することを目的とする。
この目的は、独立請求項の主題によって実現される。
好ましい実施の形態は、従属請求項の主題である。
本発明の最初の態様によれば、ビデオデータを符号化するための方法が提供される。この方法は、画像を、各々が複数の画素を含む複数のブロックに分割するステップと、1ブロック分の前記画素を変換係数に変換するステップと、予め定められた量子化区間に従って各々の係数値を量子化係数値に写像することによって、前記係数を量子化するステップとから成る。前記量子化区間は、予め定められた量子化曲線に従って設定される。前記量子化曲線は、係数値が小さくなるに従って小さくなる量子化区間を持つ非線形曲線である。
本発明のさらなる態様によれば、ビデオデータを画像ブロックに基づいて符号化する符号化装置が提供される。各々の画像ブロックは、複数の画素を含んでいる。この符号化器は、変換部と量子化器とから成る。前記変換部は、1ブロック分の画素を変換係数に変換する。前記量子化器は、予め定められた量子化区間に従って各々の係数値を量子化係数値に写像することによって、前記変換係数を量子化する。前記量子化区間は、予め定められた量子化曲線に従って設定される。前記量子化曲線は、係数値が小さくなるに従って小さくなる量子化区間を持つ非線形曲線である。
本発明の別の態様によれば、ビデオデータをブロックごとに復号化するための方法が提供される。前記符号化されたビデオデータは、量子化された係数を含んでいる。この方法は、予め定められた量子化区間に従って各々の量子化係数値を逆量子化係数値に写像することによって、前記符号化されたビデオデータの量子化係数を逆量子化するステップと、逆量子化された係数のブロックを画素のブロックに変換するステップとから成る。前記量子化区間は、予め定められた量子化曲線に従って設定される。前記量子化曲線は、係数値が小さくなるに従って小さくなる量子化区間を持つ非線形曲線である。
本発明のさらに別の態様によれば、符号化されたビデオデータをブロックごとに復号化するための復号化装置が提供される。前記符号化されたビデオデータは、量子化された係数を含んでいる。この復号化器は、逆量子化器と逆変換部とから成る。前記逆量子化器は、予め定められた量子化区間に従って各々の量子化係数値を逆量子化係数値に写像することにより、前記符号化されたビデオデータの量子化係数のブロックを逆量子化する。前記逆変換部は、逆量子化係数のブロックを画素のブロックに変換する。前記量子化区間は、予め定められた量子化曲線に従って設定される。前記量子化曲線は、係数値が小さくなるに従って小さくなる量子化区間を持つ非線形曲線である。
本発明に従って非線形の量子化曲線を用いることにより、フィルム粒子情報に合わせて量子化区間を正確に変化させること、つまり係数精度の意図した損失を正確に調整することが可能になる。より小さな係数値に対する量子化区間をより小さくすることにより、符号化ビットレートの増大、つまり符号化効率の低下を招くことなく、フィルム粒子情報を残すことが可能となる。
ビデオを符号化するための、符号化係数に量子化行列をかける非線形量子化が、米国特許第6347116号及び米国特許第6654418号から周知である。この周知の量子化における非線形性は、係数値には依存せず、個々の変換係数の変換行列の中での位置に依存する。これに対し、本発明は、係数値の大きさに依存する非線形量子化を用いる。さらに、量子化処理の際に非線形な特性曲線を適用することも知られていない。
予め定められた量子化曲線の量子化区間の1ステップの大きさは、係数値が大きくなるに従って大きくなることが望ましい。そのような量子化曲線は、量子化の際に係数の精度に割かれるデータ量を、より大きな係数値からより小さな係数値へと移動させることによって、符号化効率の維持を可能にする。
好ましい実施の形態によれば、量子化区間は、例えば区分的に線形な曲線、ルート曲線、又は対数曲線といった特別な曲線の性質に従って変化する。
量子化曲線は、パラメータによって定義され、そのパラメータは前記符号化されたビデオデータに含まれていることが望ましい。そうすれば、量子化曲線を固定して、符号化されるべきビデオデータの種類に依らずに用いなくても済むだけでなく、量子化処理の際に、例えばフィルム粒子が存在するといった画像の内容に合わせて変化させることができる。さらに、その曲線を定義するパラメータを符号化データに含めることによって、符号化及び復号化の際に同一の曲線を用いることができる。
好ましい実施の形態によれば、量子化ステップは、予め定められた量子化曲線に従って係数値を重み付けするステップと、固定された量子化区間を適用することによって重み付けされた係数値を量子化するステップとから成る。前記量子化曲線に従って係数値をその大きさに応じて重み付けすることにより、量子化が行われる前に前記曲線の性質に従って係数値が変換されるので、固定された量子化区間を用いる既存の量子化処理をそのまま利用することができる。それ故、係数値を変換する前処理のための追加のステップを挿入し、かつ復号化器の側では逆量子化された係数を後処理するだけの簡単なやり方で、既存の符号化及び復号化装置を拡張してもよい。
さらにまた好ましい実施の形態によれば、量子化曲線は、符号化されるべきビデオデータ中のフィルム粒子の存在又は存在の度合いを検出することによって選択される。そのような適応的な方法は、現在符号化されている画像の内容に応じて、常に適切な量子化曲線を選ぶことを可能にする。あるいは、前記検出を、符号化されるべきビデオデータ中のフィルム粒子の存在についてのみ行ってもよい。
本発明の上記及びその他の対象及び特徴は、添付の図面と関連付けて示される以下の説明及び好ましい実施の形態から、より明確になる。
図2を参照して、ハイブリッドビデオ符号化器の一例を説明する。このビデオ符号化器は、全体を通して参照符号100で示され、対象ビデオ画像(入力信号)と、先に符号化された画像に基づくその対象画像の予測信号との差分を決定する減算器100とを含む。変換及び量子化部120は、得られた予測誤差を空間領域から周波数領域へと変換し、得られた変換係数を量子化する。エントロピー符号化部190は、量子化された変換係数をエントロピー符号化する。
図2のビデオ符号化器の動作は、次の通りである。この符号化器は、入力されるビデオシーケンスの続く画像間の差分だけを伝送する差分パルスコード変調(DPCM)法を用いる。これらの差分は、符号化されるべきビデオ画像を受け取って、そこから対象画像の予測分を差し引く減算器110で決定される。
その予測は、先に符号化された画像の符号化器の側での復号化結果(“局所復号化画像”)に基づく。これは、ビデオ符号化器100に組み込まれる復号化部によって実現される。その復号化部は、符号化のステップを逆順に実行する。逆量子化及び逆変換部130は、量子化された係数を逆量子化し、逆量子化された係数に逆変換を適用する。加算器135で、復号化された差分が予測信号に加えられる。
図2のビデオ符号化器によって行われる動き補償されたDPCMは、対応する先行フィールド又はフレームのデータから、対象フィールド又はフレームを予測する。この予測は、対象及び先行フィールド又はフレーム間での動き推定に基づく。この動き推定は、対象及び先行フレーム間での画素のずれを表す二次元の動きベクトルとして決定される。通常、動き推定はブロックごとに行われ、対象フレームの一つのブロックが、最良の合致が見つかるまで、先行フレームのブロックと比較される。比較の結果に基づいて、対象フレームの各々のブロックについて変位ベクトルが推定される。
これは、対象入力信号と局所復号化画像とを受け取る動き推定部170によって実現される。
この動き推定の結果に基づいて、動き補償予測部160で行われる動き補償は、決定された動きベクトルを使った予測を行う。予測誤差ブロックに含まれる、対象ブロック及び予測されたブロック間の差分を表す情報は、変換部120によって変換係数に変換される。そのために、一般に二次元離散コサイン変換(DCT)が用いられる。
H.264/AVC規格に従って、入力画像はマクロブロックに分割される。マクロブロックは、“画像内”又は“画像間”符号化モードを適用して符号化される。画像間モードでは、マクロブロックは、前述したように動き補償を用いて予測される。画像内モードでは、予測信号はゼロに設定されるが、ビデオ符号化規格H.264/AVCは、後続するマクロブロックを予測するために、さらに、同じ画像の既に符号化されたマクロブロックに基づく予測の仕組みを用いる。
画像内符号化画像(Iタイプ画像)だけは、復号化済みのどの画像も参照することなく符号化することができる。このIタイプ画像は、符号化されたビデオシーケンスの誤差を回復する。さらに、このIタイプ画像は、ランダムアクセス、つまり符号化されたビデオ画像の列の中のIタイプ画像へのアクセスを可能にするために、符号化されたビットストリームへのエントリ点を提供する。画像内モード、つまり画像内予測部150による処理と、画像間モード、つまり動き補償予測部160による処理との切り替えは、画像内及び画像間スイッチ180によって制御される。
さらに、局所復号化画像におけるブロック化の影響を低減するために、デブロッキングフィルタ137を設けてもよい。
符号化された画像を復号化器の側で復元するために、符号化処理が逆順に行われる。図3に、全体を通して参照符号200で示される対応する復号化器の構成を示す概念ブロック図が示される。まず、エントロピー復号化部210で、エントロピー符号を元に戻す。エントロピー復号化された係数は、逆量子化器及び逆変換器220へ渡され、動きデータは、動き補償予測部270へ渡される。量子化係数データは、逆量子化及び逆変換器220にかけられる。予測差分を含む復元された画像ブロックは、加算器230によって予測信号に加算される。この予測信号は、画像間モードでは動き補償予測部270から生じ、画像内モードでは画像内予測部260から生じる。得られた画像は、デブロッキングフィルタ240にかけられるとしてもよく、復号化された信号は、メモリ250に蓄積され、予測部260、270にかけられる。
図4を参照して、一様な量子化器について入力係数値Wと量子化出力係数値W’との関係の一例を示す。入力係数値Wが、図2に示される量子化部120へ渡される係数値を表すと共に、W’が、図2及び図3の逆量子化部130、220から出力される逆量子化係数値を表す。この図4に示される例によれば、−Δ/2<W≦Δ/2の範囲内の全ての入力係数値は、出力係数値W’=0に量子化される。同様にして、Δ/2<W≦3Δ/2の間の入力係数値は、係数値W’=Δに量子化される。この一様な量子化、つまり、一様な量子化区間を適用する量子化は、次の式(1)で表すことができる。
式(1)に従って、入力係数値Wは量子化レベルZに写像される。Δは量子化の1ステップの大きさ、又は区間の大きさを表し、fは丸め制御パラメータを表す。丸め制御パラメータfは、隣接するステップ間の遷移位置を移動させることによって、区間の位置を確率分布に応じて調整することを可能にする。これは、図5を参照して、後でより詳細に説明される。
丸め制御パラメータfは、図4の量子化曲線についてf=Δ/2に設定される。式(1)の関数“floor(...)”は、ゼロの方へ最も近い整数への丸めを行い、関数“sgn(...)”は、入力係数値Wの符号を返す。
式(2)の演算は、“逆量子化”と呼ばれる。
図5に、量子化曲線の別の例が示される。丸め制御パラメータfを変更することで、量子化演算の丸め動作を制御できる。図4に示される例では、丸め制御パラメータf=Δ/2を用いることによって、量子化係数値W’はそれぞれ入力係数値Wの量子化区間のちょうど中央に来ている。例えば、Δ/2<W≦3Δ/2の間の全ての入力係数値は、出力係数値W’=Δに量子化される。
丸め制御パラメータに小さな値を用いると、量子化係数値W’は、入力係数値Wの区間の中央の値よりも小さくなる傾向がある。図5に、丸め制御パラメータf=0の一例が示される。そこから分かるように、入力係数値Wの各々の量子化区間は、出力係数値W’として、区間の最も小さな値に写像される。
丸め制御パラメータf=0を導入することは、次の2つの作用を及ぼす。
1.係数値0のまわりの量子化区間が大きくなる。これにより、−Δ<W≦Δの間の全ての入力係数値が出力係数値W’=0に量子化される。
2.W’≠0である量子化係数値が、量子化区間の中央に来ない。例えば、入力係数値Δ<W≦2Δの範囲が、W’=Δに量子化される。
1.係数値0のまわりの量子化区間が大きくなる。これにより、−Δ<W≦Δの間の全ての入力係数値が出力係数値W’=0に量子化される。
2.W’≠0である量子化係数値が、量子化区間の中央に来ない。例えば、入力係数値Δ<W≦2Δの範囲が、W’=Δに量子化される。
H.264/AVCのようなビデオ符号化規格は、画像内モードではf=Δ/3、画像間モードではf=Δ/6なる値を持つ丸め制御パラメータを用いる。図4に示される量子化区間と比べてこのように量子化範囲を変更することは、入力係数値の一様でない確率分布によりよく適合することを目的としている。ビデオ符号化における変換係数の一様でない確率分布は、ラプラシアン確率分布によって近似できる。図6に、ラプラシアン確率分布の一例が示される。変換係数のこのような確率分布のために、各々の量子化区間においてより小さな量子化値が現れやすくなる。そのため、量子化係数値W’がより小さな値になる丸め制御パラメータf<Δ/2が用いられる。従って、量子化係数値は量子化区間の中央には来ない。
ラプラシアン分布のパラメータは画像内及び画像間符号化モードで変わるため、それぞれの符号化モードで異なる丸め制御パラメータが用いられる。
動画に存在しているフィルム粒子の符号化に関して、フィルム粒子は、時間的に相関のない、動き補償では予測できない構造である。そのため、フィルム粒子は、予測誤差として、つまり各画像ブロックで個別に、符号化するしかない。図14aに、予測誤差を表す係数ブロックの一例が示される。
フィルム粒子情報は、特に、小さな変換係数値が順に反映された小さな予測誤差値によって表される。ビデオ符号化の際の量子化段は、ゼロのまわりの全ての係数値を0に量子化するように設計されるので、フィルム粒子情報は不可逆的に失われる。フィルム粒子情報を再生できないような、より小さな表示サイズが用いられる限り、この量子化の損失は、符号化効率を高めるために容認され意図的に行われる。図14bに、変換係数の一例が示される。そこから分かるように、最も小さな係数値に対応する量子化区間は、全ての小さな係数値をゼロに量子化するように作用する。
より多くの量子化区間が設けられるように量子化区間の大きさを縮小すれば、符号化されたビデオデータの中にフィルム粒子情報を残すことは可能である。しかしながら、そのような変更を行えば、符号化結果のビットレートはかなり増加し、それと対応して符号化効率は低下する。
別の方法に従って、例えば図4及び図5に示されるように、丸め制御パラメータfを修正してもよい。ただし、丸め制御パラメータを修正しても、最も小さな係数値に対する量子化区間の大きさを修正することしかできず、隣接する異なる量子化レベルに係数値Wを量子化する境界は、全てのしきい値について一斉に移動する。各々のしきい値のこの移動は、ラプラシアン分布への量子化の適合を損なう。その結果、量子化誤差が増加し、符号化効率が低下する。
これらの欠点を克服するため、本発明は、量子化区間の配置をパラメータで表すことを提案する。本発明に従って量子化曲線又は特性曲線を用いることによって、より小さな係数値に対して量子化区間をより小さく設定することができると共に、より大きな係数値をより大きな量子化区間を用いて量子化することができる。
この方法は、他の量子化区間の大きさに影響を及ぼさずに、ゼロに近い係数に対する量子化区間の大きさを修正することを可能にする。ビデオデータに残存するフィルム粒子の強さに直接依存して、この小さい量子化区間の大きさを修正してもよい。そうすれば、符号化されたビデオデータの所要ビットレートを増やさずに、復号化器の側で復元されるフィルム粒子情報を改善できる。
図7に、本発明の量子化曲線に従って形成される量子化区間の一例が示される。そこから分かるように、各々の量子化区間の大きさは異なる。
本発明によれば、各々の変換係数値に対する量子化区間の大きさを、ビデオ内容、つまり、符号化されるべきビデオデータに存在するフィルム粒子情報、及び利用可能なビットレートに合わせて変化させることができる。従って、本発明は、符号化ビットレートを増加させずにより良い符号化の結果が得られる、より適応性が高い量子化処理を可能にする。
好ましい実施の形態によれば、量子化曲線は、復号化器の側へ送信されるパラメータによって定義される。そのため、量子化曲線と量子化区間とを、符号化及び復号化の処理の際に更新できる。予め定められた時間間隔又は事象に応じて、更新された量子化曲線のパラメータの組が量子化器に適用され、さらに復号化器の側へ送信される。この方法で、画像の内容、特にフィルム粒子情報の存在及び程度の一方又は両方に合わせて、符号化処理を変形することができる。
第1の実施の形態によれば、量子化曲線又は特性曲線を量子化区間の調整に用いたが、第2の実施の形態では、既存の量子化区間をそのまま用いる代わりに、符号化器の側では量子化の前、及び復号化器の側では逆量子化の後に、それぞれ係数値を訂正する。図8に、本発明による非線形量子化の構成を表すブロック図が示される。
図8に示される非線形量子化方法によれば、“コア量子化処理”を行う前に入力変換係数Wがそのまま量子化されることはない。コア量子化処理が、予め定められた量子化区間に従って入力係数値を量子化レベルに写像するときに、前処理段において入力係数値を重み付けすることによって、量子化区間を調整する効果が得られる。これと対応して、復号化器の側における逆量子化器から出力される係数値は、後処理段によって、逆のやり方で重み付けされる。この重み付け処理は、式(3)で表される。
ここで、Vは重み付けされた係数値を表し、“s(..)”は入力係数値Wから重み付けされた入力係数値Vへの写像を表す。
図8に従う第2の実施の形態の実装は、次のように動作する。入力係数値Wが予め定められた特性曲線によって重み付けされる。特性曲線を定義するパラメータは、固定されていてもよく、また図8に示されるように、状況に応じて変化し、かつ符号化されたビデオデータと共に復号化器の側の逆量子化部330へ提供されてもよい。特性曲線の例が、図9から図11に関連付けて説明される。入力係数値Wは、特性曲線に従って、重み付けされた入力係数値Vに写像される。部310によって適用される演算は、式(3)で定義される。
重み付けされた係数値Vは量子化部320に渡される。量子化部320は、コア量子化部324とコア逆量子化部236とを含む。部324によって適用されるコア量子化は、式(4)で定義される。重み付けされた入力係数値Vは、固定された量子化区間の仕組みに従って、量子化レベルZに写像される。
コア逆量子化部326は、その逆の方法を適用する、すなわち、量子化レベルZを重み付けされた係数の量子化値V’に写像する。この演算は、式(5)で定義される。部330は、係数の量子化値W’を復元するために、符号化器の側の部310からパラメータ315によって知らされた適用可能な特性曲線に従って、重み付けされた係数の量子化値V’に逆の重み付けをする。
第2の実施の形態の特有の利点は、既存のコア量子化及び逆量子化処理を修正しなくてよいことである。コア量子化に前処理段を追加すると共に、対応する後処理段を逆量子化処理に追加するだけでよい。
第1及び第2の実施の形態で適用される量子化曲線の例が、図9から図11に関連付けて説明される。なお、本発明は説明される曲線の適用に限定されない。当業者は、この点において適切な他のいかなる曲線を用いてもよい。
ここで、α1,2,3は、各々の区分的に線形な部分の傾きを表す。
ここで、αが倍率パラメータを表し、“sgn(W)”は入力係数値Wの符号を返す。
復号化器の側では、特に後処理段330で、それぞれの逆演算が適用される。
図12及び図13に、本発明の第2の実施の形態における符号化器及び復号化器の構成を示す概念ブロック図が示される。図12及び図13のブロック図は、図2及び図3のブロック要素と同じブロック要素を、同じ参照符号で示す。
図12に示され、全体を通して参照符号400で示される符号化器は、図2で既に示されているブロック要素に加えて、さらに、変換部120によって出力される変換係数を前処理し、重み付けされた変換係数Vを量子化部120へ転送する処理段410を備えている。
後処理部420は、局部復号化された画像を提供する復号化段に挿入される。後処理段420は、前処理段410で係数値に施された重み付けを元に戻す。
量子化曲線を状況に応じて適用できるようにするため、曲線のパラメータ315が、符号化されたビデオデータに含められる。符号化された曲線パラメータを符号化されたビデオデータに挿入するために、量子化曲線のパラメータは符号化部430によって圧縮されることが望ましい。
図13は、図12の符号化器に対応する復号化器の構成を示す。この復号化器は、全体を通して参照符号500で示される。図3のブロック要素に加えて、後処理部510が挿入される。後処理部510は、図12の符号化装置の前処理部410で適用される操作の逆の操作を行う。量子化曲線パラメータは、符号化された形式で受信されてもよい。このために、パラメータは復号化部520によって復号化される。
図14cは、図14aに示されるブロックに対応する、4つの変換係数値ブロックを示すと共に、図14dは、本発明に従って予め定義された量子化曲線を適用した場合の4つの量子化変換係数ブロックを示している。
次に、図12及び図13の符号化器及び復号化器の動作を、図15及び図16に関連付けて説明する。
図15は、本発明に係る符号化器の動作を示すフローチャートである。符号化されるべきビデオ画像を複数のブロックに分割した後(ステップS10)、1ブロック分の画素を変換係数のブロックに変換する(ステップS20)。DCTのような直交変換を適用するのが望ましい。得られた変換係数Wを、予め定められた量子化曲線に従って重み付けする(ステップS30)。この前処理ステップは、本発明の第2の実施の形態の実装に対応する。量子化曲線は、固定された曲線でもよく、また状況に応じて変更可能な曲線でもよい。変更可能な曲線を用いるときは、復号化器が逆の操作を行えるよう、適用可能な曲線を定義するパラメータが符号化されたビデオデータに含められる。
重み付けされた変換係数Vを量子化する(ステップS40)。ステップS40は、図8のコア量子化部324によって行われるコア量子化操作を表している。
符号化されたビデオデータは、量子化係数と量子化曲線を定義するパラメータとを含んでいる。これらのデータは、メモリ装置に蓄積されてもよく、また、圧縮された画像を直ちに復元するために復号化器へ送信されてもよい。
次に、復号化処理を、図16に関連付けて説明する。まず、受信された係数を、固定された量子化区間に従って逆量子化する(ステップS50)。逆量子化操作は、図8の逆量子化部326で行われる。逆量子化された係数を、逆の重み付け操作にかける(ステップS60)。この逆の重み付け操作は、符号化処理の際にステップS30で行われる重み付け操作と対応している。調整可能な量子化曲線を用いるときは、その曲線のパラメータを符号化されたビデオデータから取得する。
重み付けされた係数の逆量子化値W’を、画素のブロックに変換し(ステップS70)、続くブロックを結合して復号化されたビデオ画像を形成する(ステップS80)。
ここで、項“Wij・MF”は量子化されるべき変換係数を表す。“MF”は、変換操作の際に倍率を適用する代わりに、量子化操作の際に適用されるべき倍率を表す。指標“ij”は変換行列における個々の変換係数の位置を表す。丸め制御パラメータfが、量子化操作を変換係数の確率分布に適合させるために用いられる。係数の確率分布が画像内符号化モードと画像間符号化モードとでは異なるために、画像内及び画像間モードで異なるfの値が用いられる。
>>演算は右シフトを表す。このような右シフト演算は、除算演算を避けて、より簡素なハードウェア実装を可能にする。この右シフト演算は、2qbitsによる除算と等価である。略号“qbits”は式(12)で与えられる。
ここで、“qbits”は量子化パラメータを表す。
式(16)の最後の項
は、1量子化ステップの大きさΔと倍率とを含んでいる。倍率は、逆量子化に由来するものであって、コア量子化の仕組みの一部ではない。逆変換の式(16)に非線形曲線を導入するために、倍率を1量子化ステップの大きさΔから分離しなくてはならない。式(12)を考慮して、その分離は次の式
によって計算される。
要約すれば、本発明は、発生するビットレートを増やさず符号化効率を維持しながら量子化処理をフィルム粒子情報によりよく適合させるために、ビデオデータを符号化するための量子化区間を状況に応じて変形可能にする。最も小さな係数値に対して量子化区間の大きさを小さくする形を選択することによって、符号化されるビデオデータの中にフィルム粒子情報を残すことができる。その逆に、最も小さな係数値の区間を広げる性質の曲線は、符号化されるビデオデータの中のフィルム粒子情報を減少させる。
Claims (36)
- ビデオデータを符号化するための、
画像を、各々が複数の画素を含む複数のブロックに分割するステップと、
1ブロック分の前記画素を変換係数に変換するステップと、
予め定められた量子化区間に従って各々の係数値を量子化係数値に写像することによって、前記係数を量子化するステップと
を含む方法であって、
前記量子化区間は、予め定められた量子化曲線に従って設定され、前記量子化曲線は、係数値が小さくなるに従って小さくなる量子化区間を持つ非線形曲線であることを特徴とする。 - 請求項1に記載の方法であって、
前記予め定められた量子化曲線による前記量子化区間の1ステップの大きさは、係数値が大きくなるに従って大きくなる。 - 請求項1に記載の方法であって、
前記量子化区間は、より大きな係数値に対して、区分的に線形な曲線、ルート曲線、又は対数曲線に従って大きくなる。 - 請求項1乃至3の何れかに記載の方法であって、
前記予め定められた量子化曲線はパラメータで定義され、前記量子化係数値は、前記予め定められたパラメータと共に、前記符号化されたビデオデータを表す。 - 請求項1乃至4の何れかに記載の方法であって、
前記量子化ステップは、
前記予め定められた量子化曲線に従って前記係数値を重み付けするステップと、
固定された量子化区間を適用して、前記重み付けされた係数値を量子化するステップとを含む。 - 請求項5に記載の方法であって、
前記固定された量子化区間は、区間の大きさが均一な量子化区間である。 - 請求項5又は6に記載の方法であって、
前記量子化曲線は、区分的に線形な曲線、ルート曲線、又は対数曲線である。 - 請求項1乃至7の何れかに記載の方法であって、さらに、
符号化されるべきビデオデータ中のフィルム粒子の存在の度合いを検出するステップと、
前記検出の結果に従って、前記予め定められた量子化曲線のパラメータを調整するステップとを含む。 - 請求項1乃至7の何れかに記載の方法であって、さらに、
符号化されるべきビデオデータ中のフィルム粒子の存在を検出するステップと、
フィルム粒子が検出された場合のみ、前記量子化曲線の適用を可能にするステップとを含む。 - 請求項1乃至9の何れかに記載の方法であって、さらに、
符号化されるべきブロックを、先に符号化されたブロックに基づいて予測するステップを含み、
前記予測ステップは、
前記符号化された係数に、前記予め定められた量子化曲線を逆のやり方で適用する逆量子化ステップを含む。 - 複数の画素を含む画像ブロックに基づいてビデオデータを符号化するための、
1ブロック分の前記画素を変換係数に変換する変換手段と、
予め定められた量子化区間に従って各々の係数値を量子化係数値に写像することによって、前記変換係数を量子化する量子化器と
を備える符号化器であって、
前記量子化区間は、予め定められた量子化曲線に従って設定され、前記量子化曲線は、係数値が小さくなるに従って小さくなる量子化区間を持つ非線形曲線であることを特徴とする。 - 請求項11に記載の符号化器であって、
前記予め定められた量子化曲線による前記量子化区間の1ステップの大きさは、係数値が大きくなるに従って大きくなる。 - 請求項11に記載の符号化器であって、
前記量子化区間は、より大きな係数値に対して、区分的に線形な曲線、ルート曲線、又は対数曲線に従って大きくなる。 - 請求項11乃至13の何れかに記載の符号化器であって、
前記予め定められた量子化曲線はパラメータで定義され、前記量子化係数値は、前記パラメータと共に、前記符号化されたビデオデータを表す。 - 請求項11乃至14の何れかに記載の符号化器であって、
前記量子化器は、
前記予め定められた特性曲線に従って前記係数値を重み付けする重み付け手段と、
固定された量子化区間を適用して、前記重み付けされた係数値を量子化するコア量子化手段とを備える。 - 請求項15に記載の符号化器であって、
前記固定された量子化区間は、区間の大きさが均一な量子化区間である。 - 請求項15又は16に記載の符号化器であって、
前記量子化曲線は、区分的に線形な曲線、ルート曲線、又は対数曲線である。 - 請求項11乃至17の何れかに記載の符号化器であって、さらに、
符号化されるべきビデオデータ中のフィルム粒子の存在の度合いを検出する検出手段と、
前記検出の結果に従って、前記予め定められた量子化曲線のパラメータを調整する設定手段とを備える。 - 請求項11乃至17の何れかに記載の符号化器であって、さらに、
符号化されるべきビデオデータ中のフィルム粒子の存在を検出する検出手段と、
フィルム粒子が検出された場合のみ、前記量子化曲線の適用を可能にする可能化手段とを備える。 - 請求項11乃至19の何れかに記載の符号化器であって、
前記符号化器は予測符号化器であり、さらに、
前記符号化されたビデオデータを復号化する復号化器を備え、
前記復号化器は、前記予め定められた量子化曲線を逆のやり方で適用する逆量子化器を含む。 - 量子化係数を含む符号化されたビデオデータをブロックごとに復号化するための、
予め定められた量子化区間に従って各々の量子化係数値を逆量子化係数値に写像することによって、前記符号化されたビデオデータの量子化係数のブロックを逆量子化するステップと、
逆量子化された係数のブロックを画素のブロックに変換するステップと
を含む方法であって、
前記量子化区間は、予め定められた量子化曲線に従って設定され、前記量子化曲線は、係数値が小さくなるに従って小さくなる量子化区間を持つ非線形曲線であることを特徴とする。 - 請求項21に記載の方法であって、
前記予め定められた量子化曲線による前記量子化区間の1ステップの大きさは、係数値が大きくなるに従って大きくなる。 - 請求項21に記載の方法であって、
前記量子化区間は、より大きな係数値に対して、区分的に線形な曲線、ルート曲線、又は対数曲線に従って大きくなる。 - 請求項21乃至23の何れかに記載の方法であって、
前記予め定められた量子化曲線はパラメータで定義され、前記量子化係数値は、前記パラメータと共に、前記符号化されたビデオデータを表す。 - 請求項24に記載の方法であって、
前記パラメータは、符号化の際に前記量子化係数値に適用された前記量子化曲線を定義する。 - 請求項21乃至25の何れかに記載の方法であって、
前記逆量子化ステップは、
固定された量子化区間を用いる逆量子化を行うことにより、前記量子化された係数を逆量子化するステップと、
前記量子化曲線に従って前記逆量子化された係数を重み付けするステップとを含む。 - 請求項26に記載の方法であって、
前記固定された量子化区間は、区間の大きさが均一な量子化区間である。 - 請求項26又は27に記載の方法であって、
前記量子化曲線は、区分的に線形な曲線、ルート曲線、又は対数曲線である。 - 量子化係数を含む符号化されたビデオデータをブロックごとに復号化するための、
予め定められた量子化区間に従って各々の量子化係数値を逆量子化係数値に写像することによって、前記符号化されたビデオデータの量子化係数のブロックを逆量子化する逆量子化器と、
逆量子化された係数のブロックを画素のブロックに変換する逆変換器と
を備える復号化器であって、
前記量子化区間は、予め定められた量子化曲線に従って設定され、前記量子化曲線は、係数値が小さくなるに従って小さくなる量子化区間を持つ非線形曲線であることを特徴とする。 - 請求項29に記載の復号化器であって、
前記予め定められた量子化曲線による前記量子化区間の1ステップの大きさは、係数値が大きくなるに従って大きくなる。 - 請求項29に記載の復号化器であって、
前記量子化区間は、より大きな係数値に対して、区分的に線形な曲線、ルート曲線、又は対数曲線に従って大きくなる。 - 請求項29乃至31の何れかに記載の復号化器であって、
前記予め定められた量子化曲線はパラメータで定義され、前記量子化係数値は、前記パラメータと共に、前記符号化されたビデオデータを表す。 - 請求項32に記載の復号化器であって、
前記パラメータは、符号化の際に前記量子化係数値に適用された前記量子化曲線を定義する。 - 請求項29乃至30の何れかに記載の復号化器であって、
前記逆量子化器は、
固定された量子化区間を用いる逆量子化を行うことにより、前記量子化された係数を逆量子化するコア逆量子化手段と、
前記量子化曲線に従って前記逆量子化された係数を重み付けする重み付け手段とを備える。 - 請求項34に記載の復号化器であって、
前記固定された量子化区間は、区間の大きさが均一な量子化区間である。 - 請求項34又は35に記載の復号化器であって、
前記量子化曲線は、区分的に線形な曲線、ルート曲線、又は対数曲線である。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP04003184A EP1569458A1 (en) | 2004-02-12 | 2004-02-12 | Encoding and decoding of video images based on a non-linear quantization |
PCT/EP2004/013591 WO2005079077A1 (en) | 2004-02-12 | 2004-11-30 | Encoding and decoding of video images based on a non-linear quantization |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2007522742A true JP2007522742A (ja) | 2007-08-09 |
Family
ID=34745851
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006552469A Pending JP2007522742A (ja) | 2004-02-12 | 2004-11-30 | 非線形量子化に基づくビデオ画像の符号化及び復号化 |
Country Status (4)
Country | Link |
---|---|
US (1) | US20110103467A1 (ja) |
EP (1) | EP1569458A1 (ja) |
JP (1) | JP2007522742A (ja) |
WO (1) | WO2005079077A1 (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2013541923A (ja) * | 2010-11-02 | 2013-11-14 | アイ−シーイーエス(イノベイティブ コンプレッション エンジニアリング ソリューションズ) | 画像,音声及び/又は映像ファイルのデジタル値を圧縮する方法 |
CN106575951A (zh) * | 2014-07-28 | 2017-04-19 | 三菱电机株式会社 | 功率编码器和用于功率编码的方法 |
Families Citing this family (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE102005016858A1 (de) * | 2005-04-12 | 2006-10-19 | Siemens Ag | Verfahren und Vorrichtung zur Reduktion eines Quantisierungsfehlers |
KR101521041B1 (ko) * | 2006-05-25 | 2015-05-15 | 톰슨 라이센싱 | 가중 인코딩을 위한 방법 및 시스템 |
US8495335B2 (en) | 2006-06-16 | 2013-07-23 | Raytheon Company | Data translation system and method |
EP2036353A1 (en) | 2006-06-29 | 2009-03-18 | Thomson Licensing | Adaptive pixel-based filtering |
US8467626B2 (en) | 2006-09-29 | 2013-06-18 | Thomson Licensing | Automatic parameter estimation for adaptive pixel-based filtering |
WO2010091503A1 (en) * | 2009-02-13 | 2010-08-19 | Research In Motion Limited | Adaptive quantization with balanced pixel-domain distortion distribution in image processing |
EP2396969A4 (en) * | 2009-02-13 | 2012-12-12 | Research In Motion Ltd | MODIFIED ENTROPIC CODING FOR IMAGES AND VIDEOS |
JP2013005204A (ja) * | 2011-06-16 | 2013-01-07 | Sony Corp | ビデオ送信装置、ビデオ受信装置、およびビデオ送信方法 |
US11039138B1 (en) * | 2012-03-08 | 2021-06-15 | Google Llc | Adaptive coding of prediction modes using probability distributions |
GB2503766B (en) * | 2012-04-05 | 2019-02-20 | British Broadcasting Corp | Video coding and decoding |
US9445109B2 (en) | 2012-10-16 | 2016-09-13 | Microsoft Technology Licensing, Llc | Color adaptation in video coding |
GB2518823A (en) * | 2013-09-25 | 2015-04-08 | Sony Corp | Data encoding and decoding |
JP6302600B2 (ja) * | 2014-09-26 | 2018-03-28 | ドルビー ラボラトリーズ ライセンシング コーポレイション | 知覚的量子化されたビデオコンテンツの符号化および復号化 |
US10694200B2 (en) * | 2017-01-23 | 2020-06-23 | Samsung Display Co., Ltd. | System and method for lightweight high quality image compression for display screens |
FR3073999B1 (fr) | 2017-11-23 | 2024-02-09 | Ateme | Compression intelligente de contenus video graines |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5313298A (en) * | 1992-03-05 | 1994-05-17 | Rubin, Bednarek And Associates, Inc. | Video companding method and system |
US6347116B1 (en) * | 1997-02-14 | 2002-02-12 | At&T Corp. | Non-linear quantizer for video coding |
US6944226B1 (en) * | 2000-10-03 | 2005-09-13 | Matsushita Electric Corporation Of America | System and associated method for transcoding discrete cosine transform coded signals |
US6868190B1 (en) * | 2000-10-19 | 2005-03-15 | Eastman Kodak Company | Methods for automatically and semi-automatically transforming digital image data to provide a desired image look |
-
2004
- 2004-02-12 EP EP04003184A patent/EP1569458A1/en not_active Withdrawn
- 2004-11-30 US US10/588,482 patent/US20110103467A1/en not_active Abandoned
- 2004-11-30 WO PCT/EP2004/013591 patent/WO2005079077A1/en active Application Filing
- 2004-11-30 JP JP2006552469A patent/JP2007522742A/ja active Pending
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2013541923A (ja) * | 2010-11-02 | 2013-11-14 | アイ−シーイーエス(イノベイティブ コンプレッション エンジニアリング ソリューションズ) | 画像,音声及び/又は映像ファイルのデジタル値を圧縮する方法 |
CN106575951A (zh) * | 2014-07-28 | 2017-04-19 | 三菱电机株式会社 | 功率编码器和用于功率编码的方法 |
JP2017517177A (ja) * | 2014-07-28 | 2017-06-22 | 三菱電機株式会社 | 電力エンコーダー及び電力符号化の方法 |
CN106575951B (zh) * | 2014-07-28 | 2020-01-17 | 三菱电机株式会社 | 功率编码器和用于功率编码的方法 |
Also Published As
Publication number | Publication date |
---|---|
EP1569458A1 (en) | 2005-08-31 |
US20110103467A1 (en) | 2011-05-05 |
WO2005079077A1 (en) | 2005-08-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2007522743A (ja) | 適応的なデッドゾーンサイズを有する量子化に基づくビデオ画像の符号化と復号化 | |
US7925107B2 (en) | Adaptive variable block transform system, medium, and method | |
US7372903B1 (en) | Apparatus and method for object based rate control in a coding system | |
EP1455536B1 (en) | Video coding apparatus and decoding apparatus | |
US7469069B2 (en) | Method and apparatus for encoding/decoding image using image residue prediction | |
JP4393875B2 (ja) | 複雑さの軽減された復号化に適したシングルレイヤビデオ符号化されたビットストリームを供給するシステム及び方法 | |
US7925108B2 (en) | Encoding device and dynamic image recording system having the encoding device | |
US20070009039A1 (en) | Video encoding and decoding methods and apparatuses | |
JP2007522742A (ja) | 非線形量子化に基づくビデオ画像の符号化及び復号化 | |
KR20110059853A (ko) | 축조 기준 프레임을 이용하여 영상을 인코딩하는 시스템 및 방법 | |
US9066073B2 (en) | Error resilient rate distortion optimization for image and video encoding | |
JP2001145113A (ja) | 画像情報変換装置及び方法 | |
US6963609B2 (en) | Image data compression | |
JP7343817B2 (ja) | 符号化装置、符号化方法、及び符号化プログラム | |
JPH0818976A (ja) | 動画像符号化/復号化装置 | |
KR20050012782A (ko) | 코딩 중에 이미지 선명도를 최적화하기 위한 방법과 시스템 | |
EP1641274B1 (en) | Video coding employing an image de-graining loop-filter | |
US7436889B2 (en) | Methods and systems for reducing requantization-originated generational error in predictive video streams using motion compensation | |
EP1720356A1 (en) | A frequency selective video compression | |
KR101345294B1 (ko) | 영상의 양자화 장치 및 방법 | |
KR20150096353A (ko) | 이미지 인코딩 시스템, 디코딩 시스템 및 그 제공방법 | |
JP3175906B2 (ja) | 画像符号化・復号方法 | |
JPH10164594A (ja) | 動画像の圧縮符号化方法およびその装置 | |
KR101307469B1 (ko) | 비디오 인코더, 비디오 디코더, 비디오 인코딩 방법 및 비디오 디코딩 방법 | |
JP4390009B2 (ja) | 符号化装置及び方法、画像処理システム |