JP2019528651A - ビデオ符号化/復号化システムのための多次元量子化技術 - Google Patents

ビデオ符号化/復号化システムのための多次元量子化技術 Download PDF

Info

Publication number
JP2019528651A
JP2019528651A JP2019511854A JP2019511854A JP2019528651A JP 2019528651 A JP2019528651 A JP 2019528651A JP 2019511854 A JP2019511854 A JP 2019511854A JP 2019511854 A JP2019511854 A JP 2019511854A JP 2019528651 A JP2019528651 A JP 2019528651A
Authority
JP
Japan
Prior art keywords
data
quantizer
pixel
pixel block
video
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2019511854A
Other languages
English (en)
Other versions
JP6780097B2 (ja
Inventor
アレキサンドロス マイケル トウラピス
アレキサンドロス マイケル トウラピス
イエピン スー
イエピン スー
デイヴィッド ウィリアム シンガー
デイヴィッド ウィリアム シンガー
シー−ジュン ウー
シー−ジュン ウー
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Apple Inc
Original Assignee
Apple Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Apple Inc filed Critical Apple Inc
Publication of JP2019528651A publication Critical patent/JP2019528651A/ja
Application granted granted Critical
Publication of JP6780097B2 publication Critical patent/JP6780097B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/13Adaptive entropy coding, e.g. adaptive variable length coding [AVLC] or context adaptive binary arithmetic coding [CABAC]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/132Sampling, masking or truncation of coding units, e.g. adaptive resampling, frame skipping, frame interpolation or high-frequency transform coefficient masking
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/15Data rate or code amount at the encoder output by monitoring actual compressed data size at the memory before deciding storage at the transmission buffer
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/167Position within a video image, e.g. region of interest [ROI]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/184Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being bits, e.g. of the compressed video stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/186Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a colour or a chrominance component
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/42Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation
    • H04N19/436Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation using parallelised computational arrangements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/42Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation
    • H04N19/439Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation using cascaded computational arrangements for performing a single operation, e.g. filtering
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/48Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using compressed domain processing techniques other than decoding, e.g. modification of transform coefficients, variable length coding [VLC] data or run-length data
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/182Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a pixel

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Computing Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Analogue/Digital Conversion (AREA)
  • Color Television Systems (AREA)

Abstract

ビデオ圧縮及び解凍システムのための向上した帯域幅制御を提供するビデオ圧縮及び解凍技術が開示される。特に、ビデオ符号化及び復号化技術は、入力ビデオを複数の次元で量子化する。これらの技術によれば、画素残差は、入力データのアレイの予測データのアレイとの比較から生成することができる。画素残差は、第1の次元で量子化することができる。量子化後に、量子化された画素残差は、変換係数のアレイに変換することができる。変換係数は、第2の次元で量子化し、エントロピ符号化することができる。復号化技術は、これらのプロセスを反転する。更に他の実施形態では、並列又はカスケードのいずれかで変換ステージの上流に複数の量子化器を設けることができ、これは、圧縮効率及び再構成されたビデオの品質の競合する利益のバランスをとるためにビデオ符号器が異なる次元でデータを量子化する、より大きな柔軟性を提供する。【選択図】図8

Description

優先権の主張
本開示は、2016年8月29日出願の「Multidimensional Quantization Techniques For Video Coding/Decoding Systems」と題された米国特許出願第15/250,608号の優先権から利益を得るものであり、その出願の全体が、参照により組み込まれる。
本開示はビデオ圧縮及び解凍技術に関し、より具体的には、ビデオ圧縮及び解凍システムのための向上した帯域幅制御及び符号化特性を提供することに関する。
MPEG−4 AVC/H.264、MPEG−H part 2/HEVC/H.265、VP9、VP10などの現代のビデオ圧縮システムは、その符号化プロセスの一部として、とりわけ空間及び時間予測、変換、量子化、インループフィルタリング、並びにエントロピ符号化を含む様々なツールを用いて圧縮を実現する。変換符号化は通常予測プロセスが実行された後の特定のブロックサイズの残差データに適用され、この情報をより良好に非相関化してエネルギ圧縮を実現する。変換処理後に結果として得られる係数は量子化され、次にエントロピ符号化される。これは一次元での量子化となる。一様量子化が通常使用される。
以前のシステムでは離散コサイン変換(Discrete Cosine Transform)(「DCT」)が使用されたが、最近ではこの変換の整数近似、並びに離散サイン変換(Discrete Sine Transform)(「DST」)が使用される。Walsh−Hadamard、Haarなどの他の変換もまた使用される。とりわけ4×4、8×8、16×16、32×32、及び64×64のブロックの予測及び変換といった、両方の予測に対して異なるブロックサイズが通常使用される。非平方変換、並びに形状適応変換も、一部のシステムでは使用され、変換の適用の前に、残差データに対する適応色空間変換も適用することができる。
いくつかのシナリオに対して、特に高ビットレート/低圧縮比に対しては、ブロックに対する変換プロセスをスキップすることが実際には有利であり、変換符号化より量子化後の良好な符号化効率を提供できることが見出された。そのようなスキームはHEVCにおいて採用され「変換スキップ」符号化モードと名付けられている。一方、H.263+などの一部のコーデックも、変換符号化及び量子化を除いて、変換及び量子化を適用する前に残差データの解像度を低減する概念を導入している。次にデコーダはそのデータを逆量子化し、変換された係数を反転し、その後結果として得られるブロックを既定の補間フィルタを用いてアップスケールして、最終的に残差信号を再構成しなければならない。次に、この残差信号は予測信号に加えられ、最終の再構成されたブロックを生成する。次に、追加のインループフィルタリングを適用することができる。この符号化モードは「低減した解像度更新」(Reduced Resolution Update)(RRU)符号化モードと名付けられた。H.263、並びにMPEG−4 AVC/H.264及びHEVC/H.265において提案されたときには、この符号化モードは画像全体に適用された。
既存の符号化技術はビデオのインループ量子化を制御するための限定された柔軟性のみを提供する。既存の符号器はサブフレーム/サブピクチャレベルでの入力データの単一の特性のみを量子化する、すなわち、ブロック又はマクロブロックレベルで行われる変換係数を量子化することができる。一部の種類の量子化は、インループで全く実行されず、サブフレームレベルで制御することができない。したがって、本発明者は、ビデオ符号器が複数の次元に沿った入力画像データを量子化し、サブフレームレベルでそれらの次元に対する量子化パラメータを選択することを可能にする符号化技術に対する必要性を認識している。
本発明の一実施形態に係るビデオ配信システムの簡略化したブロック図である。 本開示の一実施形態に係る符号化システムの機能ブロック図である。 本開示の一実施形態に係る復号化システムの機能ブロック図である。 図2の符号化システム及び図3の復号化システムに従って例示的な画素ブロックによって実行される処理を示す。 本開示の一実施形態に係る復号化方法を示す。 本開示の一実施形態に係る符号化システムの機能ブロック図である。 図6の符号化システムとともに動作可能な復号化システムの機能ブロック図である。 本開示の別の実施形態に係る符号化システムの機能ブロック図である。 本開示の一実施形態に係る復号化システムの機能ブロック図である。 本開示の別の実施形態に係る符号化システムの機能ブロック図である。 本開示の一実施形態に係る復号化システムの機能ブロック図である。 本開示の実施形態に係るフレームに対する量子化の例示的な選択を示す。 本開示の実施形態に係るフレームに対する量子化の例示的な選択を示す。
本開示の実施形態は、複数の次元に沿って入力ビデオを量子化するビデオ符号化及び復号化技術を提供する。これらの技術によれば、画素残差は、入力データのアレイの予測データのアレイとの比較から生成することができる。画素残差は第1の次元で量子化することができる。量子化後に、量子化された画素残差は変換係数のアレイに変換することができる。変換係数は第2の次元で量子化し、エントロピ符号化することができる。復号化技術はこれらのプロセスを反転する。更に他の実施形態では、並列又はカスケードのいずれかで、変換ステージの上流に複数の量子化器を設けることができ、これは、圧縮効率及び回復したビデオの品質の競合する利益のバランスをとるために、異なる次元でデータを量子化するビデオ符号器により大きな柔軟性を提供する。様々な量子化器に対するパラメータ選択は、サブフレームの粒度で行うことができる。
図1(a)は、本発明の一実施形態に係るビデオ配信システム100の簡易化したブロック図を示す。システム100は、ネットワークを介して相互に接続された複数の端末110、120を含むことができる。端末110、120は、ネットワークを介して相手先へ送信するためのビデオデータを符号化することができる。したがって、第1の端末110はローカルでビデオデータをキャプチャし、ビデオデータを符号化し、チャネルを介して符号化したビデオデータを相手先の端末120に送信することができる。受信する端末120は符号化されたビデオデータを受信し、復号化し、例えば端末120のディスプレイ上といったローカルでレンダーリングすることができる。端末がビデオデータの双方向交換に関与している場合、端末120はローカルでビデオデータをキャプチャし、ビデオデータを符号化し、別のチャネルを介して符号化したビデオデータを相手先の端末110に送信することができる。受信する端末110は端末120から送信された符号化されたビデオデータを受信し、復号化し、例えばそれ自体のディスプレイ上といったローカルでレンダーリングすることができる。説明したプロセスは、フレーム及びフィールドピクチャの符号化の両方に対して動作することができるが、簡単にするために、本論考はこの技術を完全なフレームの文脈で説明する。
ビデオ符号化システム100は様々な用途で使用することができる。第1の用途では、端末110、120は、符号化されたビデオのリアルタイム双方向交換をサポートし、それらの間でビデオ会議セッションを確立することができる。別の用途では、端末110は、予め生成されたビデオ(例えばテレビ又は映画番組)を符号化し、1つの、又は多くの場合、多数のダウンロードするクライアント(例えば端末120)への配信のために符号化したビデオを記憶することができる。したがって、符号化されたビデオはライブ又は予め生成されたものとすることができ、端末110は1対1又は1対多数の配信モデルに従って符号化したビデオを配信するメディアサーバとして機能することができる。本論考の目的のために、ビデオ及びビデオ配信スキームの種類は、特に明記しない限り重要ではない。
図1(a)では、端末110、120はスマートフォン及びタブレットコンピュータとしてそれぞれ示されているが、原則として本開示はそれに限定されない。本開示の実施形態はまた、コンピュータ(デスクトップ及びラップトップコンピュータの両方)、コンピュータサーバ、メディアプレーヤ、専用のビデオ会議機器及び/又は専用のビデオ符号化機器にも適用される。
ネットワークは、例えば有線及び/又は無線通信ネットワークを含む、端末110、120間で符号化されたビデオデータを伝達する任意の数のネットワークを表す。通信ネットワークは回線交換又はパケット交換チャネルでデータを交換することができる。代表的なネットワークとしては、電気通信ネットワーク、ローカルエリアネットワーク、広域ネットワーク、及び/又はインターネットが挙げられる。本説明の目的上、ネットワークのアーキテクチャ及びトポロジは、特に明記しない限り本開示の動作にとって重要ではない。
図1(b)は、符号化端末の構成要素を示す機能ブロック図である。符号化端末は、ビデオソース130と、プリプロセッサ135と、符号化システム140と、送信機120とを含むことができる。ビデオソース130は符号化されることになるビデオを供給することができる。ビデオソース130はローカルな環境の画像データをキャプチャするカメラ、又は何らかの他のソースからのビデオを記憶する記憶デバイスとして提供することができる。プリプロセッサ135は、符号化されることになるビデオに対する信号調整動作を実行し、符号化のためのビデオデータを準備することができる。例えば、プリプロセッサ135は、ソースビデオのフレームレート、フレーム解像度、及び他の特性を変更することができる。またプリプロセッサ135は、ソースビデオに対するフィルタリング動作を実行することができる。
符号化システム140はビデオに対する符号化動作を実行し、帯域幅を低減することができる。典型的には、符号化システム140はソースビデオ内の時間及び/又は空間冗長性を活用する。例えば、符号化システム140は、ビデオフレーム又はフィールドピクチャがサブユニット(便宜上「画素ブロック」と呼ばれる)にパースされ、個々の画素ブロックが前に符号化されたビデオデータから導出される予測された画素ブロックに対して差動的に符号化される、動き補償された予測符号化を実行することができる。所与の画素ブロックは、以下に述べる様々な予測符号化モードのうちの任意の1つに従って符号化することができる。
・入力画素ブロックが共通フレームの前に符号化/復号化されたデータに対して差動的に符号化されるイントラ符号化、
・入力画素ブロックが前に符号化/復号化されたフレームのデータに対して差動的に符号化される単一予測インタ符号化、及び
・入力画素ブロックが前に符号化/復号化されたフレームのペアのデータに対して差動的に符号化される双予測インタ符号化。
・入力画素ブロックが前に符号化/復号化されたフレーム及び現在/共通フレームからのデータの両方からのデータに対して差動的に符号化される複合インタ−イントラ符号化。
・入力画素ブロックがいくつかの前に符号化/復号化されたフレームからのデータ、並びに現在/共通フレームからの潜在的データに対して差動的に符号化される多仮説インタ−イントラ符号化。
画素ブロックはまた、前述した変換スキップ及びRRU符号化モードなどの他の符号化モードに従って符号化することができる。
符号化システム140は符号器142と、復号器143と、インループフィルタ144と、ピクチャバッファ145と、予測器146と含むことができる。符号器142は予測器146によって供給される予測された画素ブロックデータを用いて差分符号化技術を入力画素ブロックに適用することができる。復号器143は符号器142によって参照フレームとして指定された符号化されたフレームのサブセットに適用される差分符号化技術を反転することができる。インループフィルタ144はフィルタリング技術を復号器143によって生成された再構成された参照フレームに適用することができる。ピクチャバッファ145は予測動作に使用するために再構成された参照フレームを記憶することができる。予測器146はピクチャバッファに記憶された参照フレーム内から入力画素ブロックに対するデータを予測することができる。
送信機120は、チャネルCHを介して符号化されたビデオデータを復号化する端末に送信することができる。
図1(c)は、本開示の一実施形態に係る復号化端末の構成要素を示す機能ブロック図である。復号化端末は、チャネルから符号化されたビデオデータを受信する受信機160と、符号化されたデータを復号化するビデオ復号化システム170と、ポストプロセッサ180と、ビデオデータを消費するビデオシンク190とを含むことができる。
受信機160は、ネットワークからデータストリームを受信し、データストリームの成分を端末120内の適切なユニットに送信することができる。図1(b)及び図1(c)はビデオ符号化及び復号化のための機能ユニットを示しているが、端末110、120は典型的にはビデオに関連付けられたオーディオデータ用の符号化/復号化システム、及びおそらく他の処理ユニット(図示せず)を含むことになる。したがって、受信機160は、データストリームの他の要素からの符号化されたビデオデータをパースし、ビデオ復号器170に送信することができる。
ビデオ復号器170は、符号化システム140によって実行された符号化動作を反転する復号化動作を実行することができる。ビデオ復号器は、復号器172と、インループフィルタ173と、ピクチャバッファ174と、予測器175と含むことができる。復号器172は、符号器142によって符号化されたフレームに適用される差分符号化技術を反転することができる。インループフィルタ173は、フィルタリング技術を復号器172によって生成された再構成されたフレームデータに適用することができる。例えば、インループフィルタ173は、様々なフィルタリング動作(例えば、デブロッキング、デリンギングフィルタリング、サンプル適応オフセット処理など)を実行することができる。フィルタリングされたフレームデータは、復号化システムから出力することができる。ピクチャバッファ174は、予測動作に使用するために再構成された参照フレームを記憶することができる。予測器175は、符号化されたビデオデータ内に提供された予測参照データに従って、ピクチャバッファによって記憶された参照フレーム内から入力画素ブロックのデータを予測することができる。
ポストプロセッサ180は、再構成されたビデオデータを表示用に調整する動作を実行することができる。例えば、ポストプロセッサ180は符号化/復号化プロセスによって生成された出力ビデオ内の視覚アーチファクトを不明瞭化することができる様々なフィルタリング動作(例えば、デブロッキング、デリンギングフィルタリングなど)を実行することができる。ポストプロセッサ180はまた、再構成されたビデオの解像度、フレームレート、色空間などを変更し、ビデオシンク190の要件に適合させることができる。
ビデオシンク190は、再構成されたビデオを消費することができる復号化端末内の様々なハードウェア及び/又はソフトウェア構成要素を表す。ビデオシンク190は、典型的には、再構成されたビデオをレンダーリングすることができる1つ以上の表示デバイスを含むことができる。あるいは、ビデオシンク190は、後の使用のために再構成されたビデオを記憶するメモリシステムによって表すことができる。ビデオシンク190はまた、アプリケーションプログラム内に提供された制御に従って再構成されたビデオデータを処理する1つ以上のアプリケーションプログラムを含むことができる。いくつかの実施形態では、ビデオシンクは、再構成されたビデオを復号化端末とは別個の別のデバイス上のディスプレイに送信する送信システムを表すことができる。例えば、ノートブックコンピュータによって生成された再構成されたビデオを、視聴のために大型フラットパネルディスプレイに送信することができる。
(図1(b)及び図1(c)の)符号化端末及び復号化端末の前述の説明は、(図1(a)の)端末110から端末120などの端末間の単一の方向でビデオデータを符号化及び復号化するように実行される動作を示す。ビデオの双方向交換が端末110と120との間で実行されることになる用途では、それぞれの端末110、120は(図1(b)の)符号化端末に関連付けられた機能ユニットを保有することになり、それぞれの端末110、120はまた、(図1(c)の)復号化端末に関連付けられた機能ユニットを保有することになる。実際には、特定の用途において、端末110、120は単一の方向で符号化されたビデオの複数のストリームを交換することができ、この場合、単一の端末(例えば、端末110)は、内部に提供された(図1(b)の)符号化端末の複数のインスタンスを有することになる。そのような実装形態は、本説明と完全に一致している。
図2は、本開示の一実施形態に係る符号化システム200の機能ブロック図である。システム200は画素ブロック符号器210と、画素ブロック復号器220と、インループフィルタシステム230と、予測バッファ240と、予測器250と、コントローラ260と、シンタックスユニット270とを含むことができる。画素ブロック符号器及び復号器210、220並びに予測器250は、フレームの個々の画素ブロックに対して繰返し動作することができる。予測器250は、新たに提示された入力画素ブロックの符号化中に使用するためのデータを予測することができる。画素ブロック符号器210は予測符号化技術により新しい画素ブロックを符号化し、符号化された画素ブロックデータをシンタックスユニット270に提示することができる。画素ブロック復号器220は符号化された画素ブロックデータを復号化し、それから復号化された画素ブロックデータを生成することができる。インループフィルタ230は、画素ブロック復号器220によって得られた復号化された画素ブロックから組み立てられた復号化されたフレームデータに対して様々なフィルタリング動作を実行することができる。フィルタリングされたフレームデータは、予測バッファ240に記憶することができ、後で受信した画素ブロックの予測のソースとして使用することができる。シンタックスユニット270は、統制する符号化プロトコルに適合する符号化された画素ブロックデータからデータストリームを組み立てることができる。
画素ブロック符号器210は減算器212と、ダウンスケーラ213と、残差量子化器214と、変換ユニット215と、係数量子化器216と、エントロピ符号器217とを含むことができる。画素ブロック符号器210は、減算器212で入力データの画素ブロックを受け入れることができる。減算器212は予測器250から予測された画素ブロックを受信し、それから入力画素ブロックと予測された画素ブロックとの間の差を表す画素残差のアレイを生成することができる。ダウンスケーラ213は、減算器212からの残差データ出力に対して空間解像度低減を実行することができる。残差量子化器214は、ダウンスケーラ213からのサンプルデータ出力の量子化を実行することができる。量子化器214は、一様又は非一様量子化器とすることができる。変換ユニット215は、残差量子化器214からのサンプルデータ出力に変換を適用し、画素ドメインから変換係数のドメインにデータを変換することができる。係数量子化器216は、変換ユニット215によって出力された変換係数の量子化を実行することができる。量子化器216は、一様又は非一様量子化器とすることができる。エントロピ符号器217は、例えば、可変長符号語により出力を符号化することにより、係数量子化器の出力の帯域幅を低減することができる。
動作中、ダウンスケーラ213、残差量子化器214、及び係数量子化器216は、それぞれのユニットの動作を統制する符号化パラメータに従って動作することができる。例えば、ダウンスケーラ213は、その入力画素ブロックに適用するダウンスケーリングのレベルを判定する解像度量子化パラメータ(QR)に従って動作することができる。同様に、残差量子化器214は、残差量子化器214への残差サンプル入力に適用する量子化のレベルを判定する残差量子化パラメータ(QSP)に従って動作することができる。係数量子化器216は、係数量子化器216への変換係数入力に適用する量子化のレベルを判定する係数量子化パラメータ(QP)に従って動作することができる。これらの量子化器は、量子化器が一様又は非一様量子化器であるかを指定する信号モードMQP及びMQRに従って動作することができる。したがって、これらの量子化器213、214、216は、それぞれ画像データの異なる特性を量子化するために異なる次元で動作する。量子化された次元は、互いに直交する必要はない。量子化パラメータQR、QSP、及びQPは、コントローラ260によって判定することができ、明示的又は暗黙的のいずれかで、符号化システム200によって出力される符号化されたビデオデータ内で信号として伝えることができる。
一実施形態では、量子化パラメータQR、QSP、及びQPは、例えば、画素ドメインの画素ブロック内の異なる画素位置にわたって、又は変換ドメインの画素ブロック内の異なる係数位置にわたって変化することができる多値量子化パラメータとして、それらの対応する入力データに適用することができる。したがって、量子化パラメータQR、QSP、及びQPは、量子化パラメータアレイとして提供することができる。
変換ユニット215は、イベントが保証する様々な変換モードで動作することができる。例えば、変換ユニット215はDCT、DST、Walsh−Hadamard変換、Haar変換、Daubechiesウェーブレット変換などを適用するように選択することができる。一実施形態では、コントローラ260は、変換ユニット215によって適用されることになる符号化モードMを選択することができ、それに応じて変換ユニット215を構成することができる。また符号化モードMは、明示的又は暗黙的のいずれかで、符号化されたビデオデータ内で信号として伝えることができる。
画素ブロック復号器220は、画素ブロック符号器210の符号化動作を反転することができる。例えば画素ブロック復号器220は、係数逆量子化器222と、逆変換ユニット223と、残差逆量子化器224と、アップスケーラ225と、加算器226とを含むことができる。画素ブロック復号器220は、係数量子化器216の出力からその入力データを取ることができる。許容されてはいるが、画素ブロック復号器220はエントロピ符号化が無損失のイベントであるため、エントロピ符号化されたデータのエントロピ復号化を実行する必要はない。係数逆量子化器222は、画素ブロック符号器210の係数量子化器216の動作を反転することができる。逆量子化器222は、復号化された信号MQPによって指定される一様又は非一様逆量子化を実行することができる。同様に逆変換ユニット223、残差逆量子化器224、及びアップスケーラ225は、変換ユニット215、残差量子化器214、及びダウンスケーラ213それぞれの動作を反転することができる。それらは、画素ブロック符号器210内のそれらに対応するものと同じ量子化パラメータQR、QSP、及びQP、並びに変換モードMを使用することができる。残差逆量子化器224は、復号化された信号MQRによって指定される一様又は非一様逆量子化を実行することができる。ダウンスケーラ213、残差量子化器214、及び係数量子化器216の動作は、様々な点でデータを切り捨てることになる可能性があり、したがって、係数逆量子化器222、残差逆量子化器224、及びアップスケーラ225によって回復されたデータは、画素ブロック符号器210内のそれらに対応するものに提示されたデータと比較したとき、符号化誤差を有することになる可能性がある。
加算器226は、減算器212によって実行される動作を反転することができる。加算器226は、残差信号を生成するのに減算器212が使用したものと同じ予測画素ブロックを予測器250から受信することができる。加算器226は、予測画素ブロックをアップスケーラ225によって出力された再構成された残差値に加えることができ、再構成された画素ブロックデータを出力することができる。
インループフィルタ230は、回復した画素ブロックデータに対して様々なフィルタリング動作を実行することができる。例えば、インループフィルタ230は、デブロッキングフィルタ232及びサンプル適応オフセット(sample adaptive offset)(「SAO」)フィルタ233を含むことができる。デブロッキングフィルタ232は、再構成された画素ブロック間の継ぎ目でデータをフィルタリングし、符号化に起因して発生する画素ブロック間の不連続性を低減することができる。SAOフィルタは、SAOの「タイプ」に従って、例えば、エッジ方向/形状及び/又は画素/色成分レベルに基づいて、オフセットを画素値に加えることができる。インループフィルタ230は、コントローラ260によって選択されたパラメータに従って動作することができる。
予測バッファ240は、後の他の画素ブロック予測で使用するためにフィルタリングされた画素データを記憶することができる。異なる予測モードに対して異なる種類の予測データが、予測器250にて利用可能になる。例えば、入力画素ブロックに対して、イントラ予測は入力画素ブロックが配置された同じフレームの復号化されたデータから予測基準を取る。したがって、予測バッファ240は、それぞれのフレームの復号化された画素ブロックデータをそれが符号化されたように記憶することができる。同じ入力画素ブロックに対して、インター予測は、「参照フレーム」として指定された前に符号化及び復号化されたフレーム(単数又は複数)から予測基準を取ることができる。したがって、予測バッファ240は、これらの復号化された参照フレームを記憶することができる。
説明したように、予測器250は、残差を生成するのに使用する予測データを画素ブロック符号器210に供給することができる。予測器250はインター予測器252と、イントラ予測器253と、モード決定ユニット254とを含むことができる。インター予測器252は、符号化されることになる新しい画素ブロックを表す画素ブロックデータを受信することができ、入力画素ブロックを符号化するのに使用する参照フレーム(単数又は複数)から画素ブロックデータに対して予測バッファ240を検索することができる。インター予測器252は、Pモード符号化及びBモード符号化などの複数の予測モードをサポートすることができる。インター予測器252はインター予測モードを選択し、符号化される入力画素ブロックに対する最も近い一致を提供する予測データを供給することができる。インター予測器252は動きベクトルなどの予測基準インジケータを生成し、どの参照フレームのどの部分(単数又は複数)が入力画素ブロックに対する予測ソース(単数又は複数)として選択されたかを識別することができる。
イントラ予測器253は、イントラ(I)モード符号化をサポートすることができる。イントラ予測器253は、入力画素ブロックに対する最も近い一致を提供する符号化される画素ブロックと同じフレームからの符号化された画素ブロックデータの中から検索することができる。イントラ予測器253はまた、予測基準インジケータを生成し、フレームのどの部分が入力画素ブロックに対する予測ソースとして選択されたかを識別することができる。
モード決定ユニット254は、入力画素ブロックに適用されることになる最終の符号化モードを選択することができる。典型的には、モード決定ユニット254は、与えられた目標ビットレートでビデオが復号化されたときに最も小さい歪みを実現することになる予測モードを選択する。特定のチャネル挙動を満たすこと、又はランダムアクセス若しくはデータリフレッシュポリシーをサポートするといった、符号化システム200が準拠する他のポリシーを満たすように符号化モードが選択される場合に、例外が発生することがある。モード決定ユニット254は、予測データを画素ブロック符号器及び復号器210、220に出力することができ、選択されたモードに対応する予測基準インジケータとともに選択された予測モードの識別をコントローラ260に供給することができる。
コントローラ260は、符号化システム200の動作全体を制御することができる。コントローラ260は入力画素ブロック、並びにまた符号化ビットレート目標及び他の動作パラメータなどの外部制約条件の分析に基づいて、画素ブロック符号器210及び予測器250に対する動作パラメータを選択することができる。本説明に関連するように、コントローラが、ダウンスケーリングパラメータQR、残差量子化パラメータQSP、係数量子化器QP、一様又は非一様量子化器の使用、及び/又は変換モードMなどの量子化パラメータを選択するとき、それらのパラメータをシンタックスユニット270に提供することができ、シンタックスユニット270は、それらのパラメータを表すデータをシステム200によって出力される符号化されたビデオデータのデータストリームに含めることができる。コントローラ260はまた、1つ以上の量子化器ユニット(例えば、係数量子化器216)によって量子化を適用すべきでないことを判定することができ、その場合、コントローラ260は、量子化器を無効にすることができる。上述したように、コントローラ260は変換ユニット215の動作モードも判定することができる。
説明したように、量子化パラメータQR、QSP、及び/又はQPは、画素ブロックの全ての画素に一様に適用される単一の値として提供される必要はなく、代わりに、その値がそれぞれの画素位置で変化する量子化パラメータの対応するアレイとして提供することができる。一実施形態では、様々な量子化器アレイは所定のプロトコルに従って定義することができ、それぞれが異なる画素位置で対応する量子化値を有している。動作中、コントローラ260は、インデックス又は他の識別子を提供することにより、どのアレイを使用するかを識別することができる。
別の実施形態では、量子化パラメータQR、QSP、及び/又はQP(単一の値又は値のアレイであろうと)は、画像データの特性から導出することができる。例えば量子化パラメータQSPは、画素残差に対応する予測画素値の強度に基づいて選択することができる。この場合では、QSPの値は、予測器の強度値に従ってあらゆる画素に対して異なることができ、例えば、より小さな予測器の値を有するサンプルより、より大きな予測器の値を有するサンプルに対してより高くてもよい。これらの量子化パラメータは、線形、すなわち、スケーラ、定式化、又はより複雑な非線形/非一様な定式化を用いて定義することができる。
一実施形態では、量子化器は、q(i,j)=fk(p(i,j),i,j)の形式の所定の関数によって表すことができ、式中、qは、問題の量子化器を表し、i及びjは、量子化される画素ブロック内の値(画素ドメインの値又は変換ドメインの値のいずれか)の位置を表し、p(i,j)は、量子化される画素強度値を表し、fkは、qに対するp、i、及びjに関する関数を表す。シグナリングの一部として、コントローラ260は、使用されている関数を識別するデータ、及び対応する関数が機能する任意の他のデータ(例えば、対応する関数で機能することができる任意のスケーラ及びオフセット)を提供することができる。
量子化プロセスはまた、ルックアップテーブル形式(図示せず)を用いて指定することができる。ルックアップテーブル形式は、ルックアップテーブルに含まれていない特定の値の量子化/逆量子化プロセスを判定する補間技術の使用を伴うことができる。あるいは、量子化パラメータQR及び/又はQSP、QPは、前に符号化された隣接する画素ブロックの量子化パラメータから予測することができる。更なる実施形態では、量子化パラメータQR及び/又はQSP、QPの第1の組は、符号化系列のより高いレベルの構造(例えば、フレーム又はスライスヘッダ)で信号として伝えることができ、量子化パラメータQR及び/又はQSP、QPの信号で伝えられた組に対する変更は、構造の画素ブロックが符号化される際に画素ブロックごとに信号として伝えることができる。
動作中、コントローラ260は、量子化器213、214、及び216並びに変換ユニット215の動作パラメータを画像データの異なる粒度で、画素ブロックごと又はより大きな粒度(例えば、フレームごと、スライスごと、最大符号化ユニット(largest coding unit)(「LCU」)ごと、又は別の領域)のいずれかで修正することができる。一実施形態では、量子化パラメータは、符号化されたフレーム内の画素ごとに修正することができる。
加えて、説明したように、コントローラ260は、インループフィルタ230及び予測ユニット250の動作を制御することができる。そのような制御としては、予測ユニット250に対してはモード選択(ラムダ、テストされることになるモード、検索ウィンドウ、歪み戦略など)、及びインループフィルタ230に対しては、フィルタパラメータの選択、パラメータの並べ替え、加重予測などを挙げることができる。
図3は、本開示の一実施形態に係る復号化システム300の機能ブロック図である。復号化システム300は、シンタックスユニット310と、画素ブロック復号器320と、インループフィルタ330と、予測バッファ340と、予測器350とを含むことができる。シンタックスユニット310は、符号化されたビデオデータストリームを受信することができ、符号化されたデータをその成分部分に解析することができる。符号化パラメータを表すデータは、コントローラ360に供給することができ、符号化された残差を表すデータ(図2の画素ブロック符号器210によって出力されたデータ)は、画素ブロック復号器320に供給することができる。画素ブロック復号器320は、(図2の)画素ブロック符号器によって提供される符号化動作を反転することができる。インループフィルタ330は、再構成された画素ブロックデータをフィルタリングすることができる。再構成された画素ブロックデータは、表示のためにフレームに組み立てて、復号化システム200から出力ビデオとして出力することができる。フレームはまた、予測動作に使用するために予測バッファ340に記憶することができる。予測器350は、符号化されたビデオデータストリーム内で受信した符号化データによって判定されたように、予測データを画素ブロック復号器320に供給することができる。
画素ブロック復号器320は、エントロピ復号器321と、係数逆量子化器322と、逆変換ユニット323と、残差逆量子化器324と、アップスケーラ325と、加算器326とを含むことができる。エントロピ復号器321はエントロピ復号化を実行し、(図2の)エントロピ符号器217によって実行されるプロセスを反転することができる。係数逆量子化器322は、(図2の)画素ブロック符号器210の係数量子化器216の動作を反転することができる。同様に、逆変換ユニット323、残差逆量子化器324、及びアップスケーラ325は、(図2の)変換ユニット215、残差量子化器214、及びダウンスケーラ213それぞれの動作を反転することができる。それらは、符号化されたビデオデータストリーム内に提供された量子化パラメータQR、QSP、及びQP、並びに量子化器モードタイプMQP及びMQRを使用することができる。ダウンスケーラ213、残差量子化器214、及び係数量子化器216の動作は、様々な点でデータを切り捨てるため、係数逆量子化器322、残差逆量子化器324、及びアップスケーラ325によって回復されたデータは、(図2の)画素ブロック符号器210内のそれらの相当するものに提示された入力データと比較したとき、符号化誤差を有することになる可能性がある。
加算器326は、(図2の)減算器212によって実行される動作を反転することができる。加算器326は、符号化されたビデオデータストリーム内の予測基準によって判定されたように、予測器350から予測画素ブロックを受信することができる。加算器326は、予測画素ブロックをアップスケーラ325によって出力された再構成された残差値に加えることができ、再構成された画素ブロックデータを出力することができる。
インループフィルタ330は、再構成された画素ブロックデータに対して様々なフィルタリング動作を実行することができる。図示したように、インループフィルタ330は、デブロッキングフィルタ332及びSAOフィルタ333を含むことができる。デブロッキングフィルタ332は、再構成された画素ブロック間の継ぎ目でデータをフィルタリングし、符号化に起因して発生する画素ブロック間の不連続性を低減することができる。SAOフィルタは、SAOタイプに従って、例えば、エッジ方向/形状及び/又は画素レベルに基づいて、オフセットを画素値に加えることができる。他の種類のインループフィルタも同様に使用することができる。デブロッキングフィルタ332及びSAOフィルタ333の動作は、理想的には、(図2の)符号化システム200内のそれらの相当するものの動作を模倣することになる。したがって、伝送エラー又は他の異常がない場合、復号化システム300のインループフィルタ330から得られる復号化されたフレームデータは、(図2の)符号化システム200のインループフィルタ230から得られる復号化されたフレームデータと同じであることになる。このようにして、符号化システム200及び復号化システム300は、それらの対応する予測バッファ240、340に参照ピクチャの共通の組を記憶しなければならない。
予測バッファ340は、他の画素ブロックの後の予測で使用するためにフィルタリングされた画素データを記憶することができる。予測バッファ340は、イントラ予測に使用するために、それぞれのフレームの復号化された画素ブロックデータを符号化されたように記憶することができる。予測バッファ340はまた、復号化された参照フレームを記憶することができる。
説明したように、予測器350は、予測データを画素ブロック復号器320に供給することができる。予測器350は、符号化されたビデオデータストリーム内に供給される予測基準インジケータによって判定されたように、予測された画素ブロックデータを供給することができる。
コントローラ360は、符号化システム200の動作全体を制御することができる。コントローラ360は、符号化されたビデオデータストリーム内で受信したパラメータに基づいて、画素ブロック復号器320及び予測器350に対する動作パラメータを設定することができる。本説明に関連するように、これらの動作パラメータは、ダウンスケーリングパラメータQR、残差量子化パラメータQSP、及び/又は係数量子化器QPなどの量子化パラメータ、並びに逆変換ユニット323に対する動作モードMを含むことができる。説明したように、受信したパラメータは、画像データの様々な粒度で、例えば、画素ブロックごとに、フレームごとに、スライスごとに、LCUごとに、又は入力画像に対して定義された他の種類の領域に基づいて、設定することができる。
図4は、図2の符号化システム200及び図3の復号化システム300に従って例示的な画素ブロックによって実行される処理を示す。最初に、図4(a)に示すように、画素ブロック410は、それぞれが色成分当たりビット深度Bで表された、M×Nの画素のアレイとすることができる。解像度量子化(ダウンスケーリング)の後で、画素ブロック420は、依然色成分当たりビット深度Bを有する、M/QFX×N/QFYの画素のアレイとすることができる。係数量子化の後で、画素ブロック430は、変更されたビット深度Bを有する、M/QFX×N/QFYの画素のアレイとすることができる。ここで、サンプル値は、それらの元の値からサンプル精度量子化値(QSP)で除算される。変換及び量子化の後で、画素ブロック440は、その値が量子化パラメータQPによって量子化された、M/QFX×N/QFYの変換係数のアレイとすることができる。
図4(b)は、復号化中に符号化された画素ブロックによって実行される処理を示す。最初に、符号化された画素ブロック450は、その値が図4(a)に示す量子化パラメータQPによって量子化されることになる、M/QFX×N/QFYの変換係数のアレイとすることができる。逆変換及び量子化の後で、画素ブロック460は、その値が量子化パラメータQPによって誘発された損失を有する画素ブロック430の値に対応する、M/QFX×N/QFYの画素のアレイとすることができる。サンプル精度量子化の後で、画素ブロック470は、色成分当たりビット深度Bを有するが、量子化パラメータQSPによって誘発された更なる損失を有する、M/QFX×N/QFYの画素のアレイとすることができる。逆解像度量子化(アップスケーリング)の後で、画素ブロック480は、それぞれが色成分当たりビット深度Bで表され、再度符号化損失を有する、M×Nの画素のアレイとすることができる。
図4に示すように、図2及び図3の実施形態は、いくつかの次元に沿った画像データの量子化を提供する。この実施形態では、量子化は、係数変換の量子化に加えて、画像データの解像度及びビット深度に適用することができる。したがって、これらの技術は、符号化/復号化システムにより大きな柔軟性を提供し、帯域幅圧縮を実現し更に符号化品質を保持する。
図5は、本開示の一実施形態に係る復号化方法500を示す。方法500は、画素ブロックごとに符号化されたビデオデータに対して動作することができる。方法500は、符号化されたビデオデータにより提供されるメタデータを処理し、どの符号化モード(単数又は複数)が復号化される画素ブロックを符号化するために適用されたかを判定することができる(ボックス510)。方法は、符号化モードデータから、符号化された画素ブロック残差が変換ブロックの一部であるか否かを判定することができる(ボックス515)。そうである場合、方法500は、符号化されたビデオデータにより提供される量子化パラメータ(QP)に従って変換係数を逆量子化することができ(ボックス520)、符号化されたビデオデータによって識別された変換モードMに従って逆変換を適用することができる(ボックス525)。量子化パラメータQP及び変換モードMは、符号化されたビデオデータによって明示的又は暗黙的のいずれかで識別することができる。
ボックス530で、方法500は、ボックス515で存在したか又はボックス525で再構成されたかのいずれかである残差データが予測データのドメインにあるか否かを判定することができる。そうでない場合、方法500は、残差データを、画素ドメインである予測データのドメインにマッピングすることができる(ボックス535)。その後、又はボックス530で既に残差データが予測データのドメインにあると判定された場合、方法500は、予測データをボックス510〜535の処理によって再構成されたデータとマージすることができる(ボックス540)。
残差データの予測データのドメインへのマッピングは、画素ブロックの符号化中に適用された量子化動作を反転することにより、行うことができる。図5は、図2の符号化システム200によって生成された符号化されたビデオデータを復号化するときに用いることができる例示的な逆量子化動作を示す。したがって、方法500は、残差量子化を適用するか否かを判定することができ(ボックス545)、そうである場合、方法500は、符号化されたビデオデータにより提供されるパラメータQSPを用いて残差量子化を反転することができる(ボックス550)。同様に、方法500は、ダウンサンプリングを適用するか否かを判定することができ(ボックス555)、そうである場合、ダウンサンプリングがクロマのみ又は全ての色成分に適用されたかを判定することができる(ボックス560)。ダウンサンプリングが全ての成分に適用された場合、方法500は、再構成されたデータの全ての成分をアップスケールすることができる(ボックス565)。ダウンサンプリングがクロマのみに適用された場合、方法500は、再構成されたデータのクロマ成分をアップスケールすることができる(ボックス570)。再度、ダウンスケーリングのための量子化パラメータQRは、明示的又は暗黙的のいずれかで符号化されたビデオにより提供することができる。
図6は、本開示の一実施形態に係る符号化システム600の機能ブロック図である。システム600は、画素ブロック符号器610と、画素ブロック復号器620と、一対のインループフィルタシステム630.1、630.2と、一対の予測バッファ640.1、640.2と、予測システム650と、コントローラ660と、シンタックスユニット670とを含むことができる。前の実施形態と同様に、画素ブロック符号器及び復号器610、620、並びに予測システム650は、画像データの個々の画素ブロックに対して繰返し動作することができるが、インループフィルタ630.1、630.2及び予測バッファ640.1、640.2は、データのより大きなユニットに対して動作することができる。予測システム650は、新たに提示された入力画素ブロックの符号化中に使用するためのデータを予測することができる。
画素ブロック符号器610は、予測符号化技術により新しい画素ブロックを符号化し、符号化された画素ブロックデータをシンタックスユニット670に提示することができる。シンタックスユニット670は、符号化されたビデオデータ及び他のソース(図示せず)、例えば、符号化されたオーディオデータ及び/又はアプリケーションデータのソースから伝送ビットストリームを構築することができる。シンタックスユニット670は、統制する符号化プロトコルに適合する符号化された画素ブロックデータからデータストリームを組み立てることができる。
画素ブロック復号器620は、符号化された画素ブロックデータを復号化し、それから復号化された画素ブロックデータを生成する、画素ブロック符号器610に近い復号器とすることができる。この実施形態では、画素ブロック復号器620は、復号化された画素ブロックの2つのバージョンを生成することができる。第1のバージョンは、例えば、係数サンプリングを反転すること、画素ブロック符号器610によって実行される係数変換プロセスを反転すること、及び限定された予測動作を実行することにより、符号化された画素ブロックデータの限定された復号(便宜上「ベストエフォート」復号と呼ばれる)から生成することができる。第2のバージョンは、例えば、ダウンサンプリング、残差量子化などを含む、画素ブロック符号器610によって実行される全ての符号化プロセスを反転すること(「フルエフォート」復号)により、生成することができる。画素ブロック復号器620は、復号化された画素ブロックの2つのバージョンを対応するインループフィルタ630.1、630.2それぞれに出力することができる。
インループフィルタ630.1、630.2及び予測バッファ640.1、640.2は、ペアにした関係で提供することができる。第1のインループフィルタ630.1及び予測バッファ640.1は、画素ブロック復号器620によって実行される完全復号動作から出力された復号化された画素ブロックデータに対して動作することができる。第2のインループフィルタ630.2及び予測バッファ640.2は、画素ブロック復号器620によって実行される限定された復号動作から出力された復号化された画素ブロックデータに対して動作することができる。それぞれの場合では、インループフィルタ630.1、630.2は、それらの対応する復号化されたフレームデータに対して様々なフィルタリング動作を実行することができる。インループフィルタ630.1、630.2によって生成されたフィルタリングされたフレームデータは、それらの対応する予測バッファ640.1、640.2に記憶することができ、そこで、後で受信した画素ブロックの予測のソースとして使用することができる。
予測システム650は、フルエフォート復号に関連付けられた予測バッファ640.1内の動き検索を実行することにより、入力画素ブロックに対して予測データを生成することができる。予測システム650は、フルエフォート復号プロセスで使用するために、予測バッファ640.1から予測データを画素ブロック符号器610及び画素ブロック復号器620に出力することができる。予測システム650はまた、ベストエフォート復号で使用するために、予測バッファ640.2から対応する画素ブロックを画素ブロック復号器620に供給することができる。
画素ブロック符号器610は、減算器612と、ダウンスケーラ613と、残差量子化器614と、変換ユニット615と、係数量子化器616と、エントロピ符号器617とを含むことができる。画素ブロック符号器610は、減算器612で入力データの画素ブロックを受け入れることができる。減算器612は、予測システム650から予測された画素ブロックを受信し、それから入力画素ブロックと予測された画素ブロックとの間の画素の差を表す画素残差のアレイを生成することができる。ダウンスケーラ613は、減算器612からの残差データ出力に対して空間解像度低減を実行することができる。残差量子化器614は、ダウンスケーラ613からのサンプルデータ出力の量子化を実行することができる。変換ユニット615は、残差量子化器614からのサンプルデータ出力に変換を適用し、画素ドメインから変換係数のドメインにデータを変換することができる。係数量子化器616は、変換ユニット615によって出力された変換係数の量子化を実行することができる。エントロピ符号器617は、例えば、可変長符号語により出力を符号化することにより、係数量子化器の出力の帯域幅を低減することができる。
動作中、ダウンスケーラ613、残差量子化器614、及び係数量子化器616は、それぞれのユニットの動作を統制する符号化パラメータに従って動作することができる。例えば、ダウンスケーラ613は、その入力画素ブロックに適用するダウンスケーリングのレベルを判定する解像度量子化パラメータQRに従って動作することができる。同様に、残差量子化器614は、残差量子化器614への残差サンプル入力に適用する量子化のレベルを判定する残差量子化パラメータQSPに従って動作することができる。係数量子化器616は、係数量子化器616への変換係数入力に適用される量子化のレベルを判定する係数量子化パラメータQPに従って動作することができる。前の実施形態と同様に、これらの量子化器613、614、616のそれぞれは、画像データの異なる特性を量子化するため、異なる次元で動作する。量子化された次元は、互いに直交する必要はない。量子化パラメータQR、QSP、及びQPは、コントローラ660によって判定することができ、明示的又は暗黙的のいずれかで、符号化システム600によって出力される符号化されたビデオデータ内で信号として伝えることができる。これらの量子化器はまた、一様又は非一様に動作することができる。
変換ユニット615は、イベントが保証する様々な変換モードで動作することができる。例えば、変換ユニット615は、DCT、DST、Walsh−Hadamard変換、Haar変換、Daubechiesウェーブレット変換などを適用するように選択することができる。一実施形態では、コントローラ660は、変換ユニット615によって適用されることになる符号化モードMを選択することができ、それに応じて変換ユニット615を構成することができる。符号化モードMはまた、明示的又は暗黙的のいずれかで、符号化されたビデオデータ内で信号として伝えることができる。
画素ブロック復号器620は、画素ブロック符号器610の符号化動作を反転することができる。例えば、画素ブロック復号器620は、係数逆量子化器622と、逆変換ユニット623と、残差逆量子化器624と、アップスケーラ625と、一対の加算器626.1、626.2とを含むことができる。画素ブロック復号器620は、係数量子化器616の出力からその入力データを取ることができる。許容されてはいるが、画素ブロック復号器620は、エントロピ符号化が無損失のイベントであるため、エントロピ符号化されたデータのエントロピ復号化を実行する必要はない。係数逆量子化器622は、画素ブロック符号器610の係数量子化器616の動作を反転することができる。同様に、逆変換ユニット623、残差逆量子化器624、及びアップスケーラ625は、変換ユニット615、残差量子化器614、及びダウンスケーラ613それぞれの動作を反転することができる。それらは、画素ブロック符号器610内のそれらに対応するものと同じ量子化パラメータQR、QSP、及びQP、並びに変換モードMを使用することができる。ダウンスケーラ613、残差量子化器614、及び係数量子化器616の動作は、様々な点でデータを切り捨てることになる可能性があり、したがって、係数逆量子化器622、残差逆量子化器624、及びアップスケーラ625によって回復されたデータは、画素ブロック符号器610内のそれらに対応するものに提示されたデータと比較したとき、符号化誤差を有することになる可能性がある。
加算器626.1は、減算器612によって実行される動作を反転することができる。加算器626.1は、残差信号を生成するのに減算器612が使用したものと同じ予測画素ブロックを予測システム650から受信することができる。加算器626.1は、予測画素ブロックをアップスケーラ625によって出力された再構成された残差値に加えることができ、再構成された画素ブロックデータを出力することができる。
係数逆量子化器622、逆変換ユニット623、残差逆量子化器624、アップスケーラ625、及び第1の加算器626.1は、画素ブロック復号器620のフルエフォート復号経路を定義することができる。それは、画素ブロック符号器610のサブユニット、すなわち、減算器612、ダウンスケーラ613、残差量子化器614、変換ユニット615、及び係数量子化器616に対応するものとして動作する復号化ユニットの全アレイを含む。
第2の加算器626.2は、逆変換ユニット623から、画素ブロック符号器610の符号化ユニットに対応するものの全部の組ではない復号化ユニットの組から生成された画素残差データを表す入力を取ることができる。そのように、第2の加算器626.2は、画素ブロック復号器620のベストエフォート復号経路を定義する。第2の加算器626.2は、予測システム650から、フルエフォートの予測バッファ640.1から導出された予測基準を用いてベストエフォートの予測バッファ640.2から取られた予測データを受け入れる。すなわち、予測システム650が入力画素ブロックに対する予測基準としてフルエフォートの予測バッファ640.1からの所与のフレームから画素ブロックを選択する場合、予測システム650は、選択された画素ブロックを減算器612及びフルエフォートの加算器626.1に提出することになる。予測システム650はまた、ベストエフォートの予測バッファ640.2に記憶されたのと同じフレームの同じ位置から画素ブロックを第2の加算器626.2に提出することになる。
インループフィルタ630.1、630.2は、それらの対応する画素ブロックデータに対して様々なフィルタリング動作を実行することができる。例えば、インループフィルタ630.1、630.2は、デブロッキングフィルタ及びSAOフィルタ(図示せず)を含むことができる。デブロッキングフィルタは、再構成された画素ブロック間の継ぎ目でデータをフィルタリングし、符号化に起因して発生する画素ブロック間の不連続性を低減することができる。SAOフィルタは、SAOタイプに従って、例えば、エッジ方向/形状及び/又は画素レベルに基づいて、オフセットを画素値に加えることができる。インループフィルタ630.1、630.2は、コントローラ660によって選択されたパラメータに従って動作することができる。
予測バッファ640.1、640.2は、後の他の画素ブロックの予測で使用するために、対応するインループフィルタ630.1、630.2からのフィルタリングされた画素データを記憶することができる。異なる予測モードに対しては異なる種類の予測データが、予測システム650にて利用可能になる。説明したように、入力画素ブロックに対して、イントラ予測は入力画素ブロックが配置された同じフレームの復号化されたデータから予測基準を取る。したがって、予測バッファ640.1、640.2は、それぞれのフレームの復号化された画素ブロックデータをそれが符号化されたように記憶することができる。同じ入力画素ブロックに対して、インタ予測は、「参照フレーム」として指定された前に符号化され復号化されたフレーム(単数又は複数)から予測基準を取ることができる。したがって、予測バッファ640.1、640.2は、これらの復号化された参照フレームを記憶することができる。
説明したように、予測システム650は、残差の生成に使用するために予測データを画素ブロック符号器610に供給することができる。予測システム650は、モード決定ユニット652及び一対の予測ユニット654.1、654.2を含むことができる。モード決定ユニット652は、前述の実施形態のインター予測器及びイントラ予測器を含むことができる。したがって、モード決定ユニット652は、符号化されることになる新しい画素ブロックを表す画素ブロックデータを受信することができ、入力画素ブロックを符号化するのに使用するために参照フレーム(単数又は複数)から画素ブロックデータに対してフルエフォートの予測バッファ640.1を検索することができる。決定ユニット652は、単一リスト予測モード及び双予測モードなどの複数の予測モードをサポートすることができる。インタ符号化が選択されている場合、モード決定ユニットは、動きベクトルなどの予測基準インジケータを生成し、どの参照フレームのどの部分(単数又は複数)が入力画素ブロックに対する予測のソース(単数又は複数)として選択されたかを識別することができる。
モード決定ユニット652はまた、イントラ(I)モード符号化をサポートすることができる。したがって、モード決定ユニット652は、入力画素ブロックに対する最も近い一致を提供する符号化される画素ブロックと同じフレームからの符号化された画素ブロックデータに対するフルエフォートの予測バッファ640.1を検索することができる。I符号化が選択されている場合、モード決定ユニット652はまた、予測基準インジケータを生成し、フレームのどの部分が入力画素ブロックに対する予測のソースとして選択されたかを識別することができる。
説明したように、典型的には、モード決定ユニット652は、ビデオが復号化されたときに最も小さい歪みを実現することになる予測モードを選択する。ランダムアクセス又はデータ更新ポリシーなどをサポートする符号化システム600が準拠する他のポリシーを満たすように符号化モードが選択される場合に、例外が発生することがある。一実施形態では、モード決定ユニット652は、フルエフォートの復号経路及びベストエフォートの復号経路によって得られる復号化されたビデオデータに蓄積する符号化誤差を監視することができる。モード決定ユニットは、例えば、ベストエフォートの復号経路内で蓄積された符号化誤差が所定値を上回ると判定する場合に、その既定の予測決定を変更することができる。
フルエフォートの予測器654.1は、モード決定ユニット652によって生成された予測基準によって識別されたフルエフォートの予測バッファ640.1からの予測データを減算器612及びフルエフォートの加算器626.1に提出することができる。ベストエフォートの予測器654.2は、モード決定ユニット652によって生成された予測基準によって識別されたベストエフォートの予測バッファ640.2からの予測データをベストエフォートの加算器626.2に提出することができる。
コントローラ660は、符号化システム600の全体動作を制御することができる。コントローラ660は、入力画素ブロック、並びにまた符号化ビットレート目標及び他の動作パラメータなどの外部制約条件の分析に基づいて、画素ブロック符号器610及び予測システム650に対する動作パラメータを選択することができる。本説明に関連するように、コントローラが、ダウンスケーリングパラメータQR、残差量子化パラメータQSP、係数量子化器QP、及び/又は変換モードMなどの量子化パラメータを選択するとき、それらのパラメータをシンタックスユニット670に提供することができ、シンタックスユニット670は、それらのパラメータを表すデータをシステム600によって出力される符号化されたビデオデータのデータストリームに含めることができる。コントローラ660はまた、1つ以上の量子化器ユニット(例えば、係数量子化器616)によって量子化を適用すべきでないことを判定することができ、その場合、コントローラ660は、量子化器を無効にすることができる。上述したように、コントローラ660はまた、変換ユニット615の動作モードを判定することができる。
説明したように、量子化パラメータQR、QSP、及び/又はQPは、画素ブロックの全ての画素に一様に適用される単一の値として提供される必要はなく、代わりに、その値がそれぞれの画素位置で変化する量子化パラメータの対応するアレイとして提供することができる。一実施形態では、様々な量子化器アレイは、所定のプロトコルに従って、それぞれが異なる画素位置で対応する量子化値を有すると定義することができる。動作中、コントローラ660は、インデックス又は他の識別子を提供することにより、どのアレイを使用するかを識別することができる。
別の実施形態では、量子化パラメータQR、QSP、及び/又はQPは(単一の値又は値のアレイであろうと)、画像データの特性から導出することができる。例えば、量子化パラメータQSPは、それらの対応する予測サンプルの強度に基づいて、それぞれのサンプル位置に対して選択され、例えば、より大きな量子化器の値は、より小さな予測サンプル値に対してより、より大きな予測サンプル値に対して選択することができる。これらの量子化パラメータは、線形、すなわち、スケーラ、定式化、又はより複雑な非線形/非一様な定式化を用いて定義することができる。
一実施形態では、量子化器は、q(i,j)=fk(p(i,j),i,j)の形式の所定の関数によって表すことができ、式中、qは、問題の量子化器を表し、i及びjは、量子化される画素ブロック内の値(画素ドメインの値又は変換ドメインの値のいずれか)の位置を表し、p(i,j)は、量子化される画素強度値を表し、fkは、qに対するp、i、及びjに関する関数を表す。シグナリングの一部として、コントローラ260は、使用されている関数を識別するデータ、及び対応する関数が機能する任意の他のデータ(例えば、対応する関数で機能することができる任意のスケーラ及びオフセット)を提供することができる。
量子化プロセスはまた、ルックアップテーブル形式(図示せず)を用いて指定することができる。ルックアップテーブル形式は、ルックアップテーブルに含まれていない特定の値の量子化/逆量子化プロセスを判定する補間技術の使用を伴うことができる。あるいは、量子化パラメータQR及び/又はQSP、QPは、前に符号化された隣接する画素ブロックの量子化パラメータから予測することができる。更なる実施形態では、量子化パラメータQR及び/又はQSP、QPの第1の組は、符号化系列のより高いレベルの構造(例えば、フレーム又はスライスヘッダ)で信号で伝えることができ、量子化パラメータQR及び/又はQSP、QPの信号で伝えられた組に対する変更は、構造の画素ブロックが符号化される際に画素ブロックごとに信号として伝えることができる。
動作中、コントローラ660は、量子化器613、614、及び616並びに変換ユニット615の動作パラメータを画像データの異なる粒度で、画素ブロックごと又はより大きな粒度(例えば、フレームごと、スライスごと、LCUごと、又は別の領域)のいずれかで修正することができる。一実施形態では、量子化パラメータは、符号化されたフレーム内の画素ごとに修正することができる。
加えて、説明したように、コントローラ660は、インループフィルタ630.1、630.2、及び予測システム650の動作を制御することができる。そのような制御としては、予測ユニット650に対してはモード選択(ラムダ、テストされることになるモード、検索ウィンドウ、歪み戦略など)、及びインループフィルタ630.1、630.2に対してはフィルタパラメータの選択、パラメータの並べ替え、加重予測などを挙げることができる。
図6の符号化システム600は、図2の実施形態で提供される符号化の柔軟性を提供し、加えて、様々な種類の復号器を有する用途を見出す。符号化システム600は、伝送エラーがない場合、図3の復号化システム300と同調して動作するように、データを符号化することができる。符号化システム600はまた、(図3の)バイパス路327により表されるフル復号モードとベストエフォートモードとの間で動作を交互に行うことができる復号化システム300とともに動作することができる。
図6の符号化システム600はまた、より能力が低いビデオ復号器、例えば、図3の復号化システム300と比較して残差逆量子化器324又はアップスケーラ325を保有しない、復号器720を有する図7に示すようなビデオ復号化システム700で動作する、符号化されたビデオデータを生成することができる。(図6の)符号化システム600が、ベストエフォート復号経路内の符号化誤差の蓄積を考慮し軽減する符号化決定を行なう場合、図7に示す復号化システム700などは、通用する符号化特性を有する符号化されたビデオを復号化することができる。
図8は、本開示の別の実施形態に係る符号化システム800の機能ブロック図である。システム800は、画素ブロック符号器810と、画素ブロック復号器820と、インループフィルタシステム830と、予測バッファ840と、予測器850と、コントローラ860と、シンタックスユニット870とを含むことができる。画素ブロック符号器及び復号器810、820並びに予測器850は、個々の画素ブロックに対して繰返し動作することができる。予測器850は、新たに提示された画素ブロックの符号化中に使用するためのデータを予測することができる。画素ブロック符号器810は、予測符号化技術により新しい画素ブロックを符号化し、符号化された画素ブロックデータをシンタックスユニット870に提示することができる。画素ブロック復号器820は、符号化された画素ブロックデータを復号化し、それから復号化された画素ブロックデータを生成することができる。インループフィルタ830は、画素ブロック復号器820によって得られた復号化された画素ブロックから組み立てられた復号化されたフレームデータに対して様々なフィルタリング動作を実行することができる。フィルタリングされたフレームデータは、予測バッファ840に記憶することができ、後で受信した画素ブロックの予測のソースとして使用することができる。シンタックスユニット870は、統制する符号化プロトコルに適合する符号化された画素ブロックデータから、データストリームを組み立てることができる。
画素ブロック符号器810は、減算器812と、複数の量子化器813.1〜813.Nと、変換ユニット814と、係数量子化器815と、エントロピ符号器816とを含むことができる。画素ブロック符号器810は、減算器812で入力データの画素ブロックを受け入れることができる。減算器812は、予測器850から予測された画素ブロックを受信し、入力画素ブロックと予測された画素ブロックとの間の差を表す画素残差のアレイを生成することができる。量子化器813.1〜813.Nはそれぞれ、画像データの異なるドメインで受信するデータの量子化を実行することができる。変換ユニット814は、量子化器の最後813.Nから入力されたデータに変換を適用し、画素ドメインから変換係数のドメインに入力データを変換することができる。係数量子化器815は、変換ユニット814によって出力された変換係数の量子化を実行することができる。エントロピ符号器816は、例えば、可変長符号語により出力を符号化することにより、係数量子化器の出力の帯域幅を低減することができる。
量子化器813.1〜813.Nはそれぞれ、画像データの対応するドメインで受信するデータの量子化を実行することができる。繰り返しになるが、量子化された次元は互いに直交する必要はない。量子化器813.1〜813.Nは、前述の実施形態のダウンスケーラ及び残差量子化器を含むことができる。量子化器813.1〜813.Nはまた、色成分専用の量子化器、周波数ドメイン量子化器、方向的に専用(例えば、水平のみ、垂直のみ、及び両方がブレンドされた)の量子化器、輝度専用の残差スケーラなどの他の種類の量子化器を含むことができる。量子化器813.1〜813.Nは、提供する量子化のレベルを定義する対応する量子化パラメータQ1〜QNに従って動作することができる。量子化パラメータQ1〜QNは、符号化されたビットストリーム内で、明示的又は暗黙的のいずれかで、復号化システムに信号として伝えることができる。いくつかのシナリオでは、個々の量子化器813.1、813.2、...、813.Nは、無効にすることができ、その場合、単に、変更なしにそれらの入力データを次の量子化器に渡すことができる。
変換ユニット814は、イベントが保証する様々な変換モードで動作することができる。例えば、変換ユニット814は、DCT変換、DST変換、Walsh−Hadamard変換、Haar変換、Daubechiesウェーブレット変換などを適用するように選択することができる。一実施形態では、コントローラ860は、変換ユニット814によって適用されることになる符号化モードを選択することができ、それに応じて変換ユニット814を構成することができる。変換モードMはまた、明示的又は暗黙的のいずれかで、符号化されたビデオデータ内で信号として伝えることができる。
画素ブロック復号器820は、画素ブロック符号器810の符号化動作を反転する復号化ユニットを含むことができる。例えば、画素ブロック復号器820は、係数逆量子化器822と、逆変換ユニット823と、複数の逆量子化器824.1〜824.Nと、加算器825とを含むことができる。画素ブロック復号器820は、係数量子化器815の出力から入力データを取ることができる。繰り返しになるが、許容されてはいるが、画素ブロック復号器820は、エントロピ符号化が無損失のイベントであるため、エントロピ符号化されたデータのエントロピ復号化を実行する必要はない。係数逆量子化器822は、画素ブロック符号器810の係数量子化器815の動作を反転することができる。同様に、逆変換ユニット823及び逆量子化器824.1〜824.Nは、変換ユニット814及び量子化器813.1〜813.Nそれぞれの動作を反転することができる。それらは、画素ブロック符号器810内のそれらに対応するものと同じ量子化パラメータQ1〜QN及び変換モードMを使用することができる。量子化器813.1〜813.N及び係数量子化器815の動作は、様々な点でデータを切り捨てることになる可能性があり、したがって逆量子化器824.1〜824.Nによって回復されたデータは、画素ブロック符号器810内のそれらの相当するものに提示されたデータと比較したとき、符号化誤差を有することになる可能性がある。
加算器825は、減算器812によって実行される動作を反転することができる。加算器825は、残差信号を生成するのに減算器812が使用したのと同じ予測画素ブロックを予測器850から受信することができる。加算器825は、予測画素ブロックを最終の逆量子化器824.1によって出力された再構成された残差値に加えることができ、再構成された画素ブロックデータを出力することができる。
インループフィルタ830は、再構成された画素ブロックデータに対して様々なフィルタリング動作を実行することができる。例えば、インループフィルタ830は、デブロッキングフィルタ832及びSAOフィルタ833を含むことができる。デブロッキングフィルタ832は、再構成された画素ブロック間の継ぎ目でデータをフィルタリングし、符号化に起因して発生する画素ブロック間の不連続性を低減することができる。SAOフィルタ833は、SAOタイプに従って、例えば、エッジ方向/形状及び/又は画素レベルに基づいて、オフセットを画素値に加えることができる。インループフィルタ830は、コントローラ860によって選択されたパラメータに従って動作することができる。
予測バッファ840は、後の他の画素ブロックの予測で使用するためにフィルタリングされた画素データを記憶することができる。異なる予測モードに対して異なる種類の予測データが、予測器850にて利用可能になる。例えば、入力画素ブロックに対して、イントラ予測は入力画素ブロックが配置された同じフレームの復号化されたデータから予測基準を取る。したがって、予測バッファ840は、それぞれのフレームの復号化された画素ブロックデータをそれが符号化されたように記憶することができる。同じ入力画素ブロックに対して、インタ予測は、参照フレームとして指定された前に符号化され復号化されたフレーム(単数又は複数)から予測基準を取ることができる。したがって、予測バッファ840は、これらの復号参照フレームを記憶することができる。
説明したように、予測器850は、残差を生成するために使用する予測データを画素ブロック符号器810に供給することができる。予測器850は、インター予測器852と、イントラ予測器853と、モード決定ユニット854とを含むことができる。インター予測器852は、符号化されることになる新しい画素ブロックを表す画素ブロックデータを受信することができ、入力画素ブロックを符号化するのに使用するために参照フレーム(単数又は複数)から画素ブロックデータに対して予測バッファ840を検索することができる。インター予測器852は、1つ又は1対の参照フレームから予測データを供給する、P及びBモード符号化などの複数の予測モードをサポートすることができる。インター予測器852は、インター予測モードを選択し、符号化される入力画素ブロックに対する最も近い一致を提供する予測データを供給することができる。インター予測器852は、動きベクトルなどの予測基準インジケータを生成し、どの参照フレームのどの部分(単数又は複数)が入力画素ブロックに対する予測のソース(単数又は複数)として選択されたかを識別することができる。
イントラ予測器853は、イントラ符号化をサポートすることができる。イントラ予測器853は、入力画素ブロックに対する最も近い一致を提供する符号化される画素ブロックと同じフレームからの符号化された画素ブロックデータの中から検索することができる。イントラ予測器853はまた、予測基準インジケータを生成し、フレームのどの部分が入力画素ブロックに対する予測のソースとして選択されたかを識別することができる。
更なる実施形態では、予測器850は、入力画素ブロックを符号化するときに予測を実行すべきでないと判定することができる。このイベントでは、予測器850は、減算器812を無効(実際には予測データを減算器812に提供しない)にすることができ、減算器812は、画素値を量子化器チェーン813.1〜813.Nに出力することができる。量子化器813.1〜813.Nは、この動作モードでは、画素残差ではなく画素値に対して動作することになる。同様に、画素ブロック復号器820は、このようにして符号化された画素ブロックを復号化するときに加算器825を無効にすることができる。更に、コントローラ860は、復号化されたビットストリーム内にモード決定信号を提供することができ、モード決定信号は、(図9の)復号器によって処理されると、このようにして符号化された画素ブロックを復号化するときに、復号器内の加算器も無効になる。
モード決定ユニット854は、入力画素ブロックに適用されることになる最終の符号化モードを選択することができる。典型的には、モード決定ユニット854は、ビデオが復号化されたときに最も小さい歪みを実現することになる予測モードを選択する。ランダムアクセス又はデータ更新ポリシーをサポートすることなどの、符号化システム800が準拠する他のポリシーを満たすように符号化モードが選択される場合に、例外が発生することがある。モード決定ユニット854は、予測データを画素ブロック符号器及び復号器810、820に出力することができ、選択されたモードに対応する予測基準インジケータとともに選択された予測モードの識別をコントローラ860に供給することができる。
コントローラ860は、符号化システム800の動作全体を制御することができる。コントローラ860は、入力画素ブロック、並びにまた符号化ビットレート目標及び他の動作パラメータなどの外部制約条件の分析に基づいて、画素ブロック符号器810及び予測器850に対する動作パラメータを選択することができる。本説明に関連するように、コントローラが、量子化パラメータQ1〜QN及び変換モードMを選択するとき、それらのパラメータをシンタックスユニット870に提供することができ、シンタックスユニット870は、それらのパラメータを表すデータをシステム800によって出力される符号化されたビデオデータのデータストリームに含めることができる。コントローラ860はまた、1つ以上の量子化器ユニット(例えば、量子化器813.2)によって量子化を適用すべきでないことを判定することができ、その場合、コントローラ860は、量子化器813.2を無効にすることができる。上述したように、コントローラ860はまた、変換ユニット814の動作モードを判定することができる。
別の実施形態では、量子化パラメータQ1〜QNは(単一の値又は値のアレイであろうと)画像データの特性から導出することができる。例えば、量子化パラメータQ1は、画素残差に対応する予測画素値の強度に基づいて選択することができる。この場合では、Q1の値は、予測器の強度値に従ってあらゆる画素に対して異なることができ、例えば、より小さな予測器の値を有するサンプルより、より大きな予測器の値を有するサンプルに対してより高くてもよい。これらの量子化パラメータは、線形、すなわち、スケーラ、定式化、又はより複雑な非線形/非一様な定式化を用いて定義することができる。
一実施形態では、量子化器は、q(i,j)=fk(p(i,j),i,j)の形式の所定の関数によって表すことができ、式中、qは、問題の量子化器を表し、i及びjは、量子化される画素ブロック内の値(画素ドメインの値又は変換ドメインの値のいずれか)の位置を表し、p(i,j)は、量子化される画素強度値を表し、fkは、qに対するp、i、及びjに関する関数を表す。シグナリングの一部として、コントローラ260は、使用されている関数を識別するデータ、及び対応する関数が機能する任意の他のデータ(例えば、対応する関数で機能することができる任意のスケーラ及びオフセット)を提供することができる。
量子化プロセスはまた、ルックアップテーブル形式(図示せず)を用いて指定することができる。ルックアップテーブル形式は、ルックアップテーブルに含まれていない特定の値の量子化/逆量子化プロセスを判定する補間技術の使用を伴うことができる。あるいは、量子化パラメータQ1〜QNは、前に符号化された隣接する画素ブロックの量子化パラメータから予測することができる。更なる実施形態では、量子化パラメータQ1〜QNの第1の組は、符号化系列のより高いレベルの構造(例えば、フレーム又はスライスヘッダ)で信号として伝えることができ、量子化パラメータQ1〜QNの信号で伝えられた組に対する変更は、構造の画素ブロックが符号化される際に画素ブロックごとに信号として伝えることができる。
動作中、コントローラ860は、量子化器813、814、及び815並びに変換ユニット814の動作パラメータを画像データの異なる粒度で、画素ブロックごと又はより大きな粒度、例えば、フレームごと、スライスごと、LCUごと、又は別の領域、のいずれかで修正することができる。一実施形態では、量子化パラメータは、画素ごとに修正することができる。
加えて、説明したように、コントローラ860は、インループフィルタ830及び予測器850の動作を制御することができる。そのような制御としては、予測器850に対してはモード選択(ラムダ、テストされることになるモード、検索ウィンドウ、歪み戦略など)、及びインループフィルタ830に対してはフィルタパラメータの選択、パラメータの並べ替え、加重予測などを挙げることができる。
図9は、本開示の一実施形態に係る復号化システム900の機能ブロック図である。復号化システム900は、シンタックスユニット910と、画素ブロック復号器920と、インループフィルタ930と、予測バッファ940と、予測器950と、コントローラ960と含むことができる。シンタックスユニット910は、符号化されたビデオデータストリームを受信することができ、符号化されたデータをその成分部分にパース解析することができる。符号化パラメータを表すデータは、コントローラ960に提出することができ、符号化された残差を表すデータ(図8の画素ブロック符号器810によって出力されたデータ)は、画素ブロック復号器920に提出することができる。画素ブロック復号器920は、(図8の)画素ブロック符号器810によって提供される符号化動作を反転することができる。インループフィルタ930は、再構成された画素ブロックデータをフィルタリングすることができる。再構成された画素ブロックデータは、表示のためにフレームに組み立てて、復号化システム900から出力ビデオとして出力することができる。フレームはまた、予測動作に使用するために予測バッファ940に記憶することができる。予測器950は、符号化されたビデオデータストリーム内で受信した符号化データによって判定されたように、予測データを画素ブロック復号器920に供給することができる。
画素ブロック復号器920は、エントロピ復号器921と、係数逆量子化器922と、逆変換ユニット923と、複数の逆量子化器924.1〜924.Nと、加算器926とを含むことができる。エントロピ復号器921は、エントロピ復号化を実行し、(図8の)エントロピ符号器816によって実行されるプロセスを反転することができる。係数逆量子化器922は、(図8の)画素ブロック符号器810の係数量子化器815の動作を反転することができる。同様に、逆変換ユニット923及び逆量子化器924.1〜924.Nは、(図8の)変換ユニット814及び量子化器813.1〜813.Nそれぞれの動作を反転することができる。それらは、符号化されたビデオデータストリーム内で提供される量子化パラメータQ1〜QN及び変換モードMを使用することができる。量子化器813.1〜813.N及び係数量子化器815の動作は、様々な点でデータを切り捨てるため、係数逆量子化器922及び逆量子化器924.1〜924.Nによって再構成されたデータは、(図8の)画素ブロック符号器810内のそれらの相当するものに提示された入力データと比較したとき、符号化誤差を有することになる可能性がある。
加算器925は、(図8の)減算器812によって実行される動作を反転することができる。加算器は、符号化されたビデオデータストリーム内の予測基準によって判定されたように、予測器950から予測画素ブロックを受信することができる。加算器925は、予測画素ブロックを先行する逆量子化器924.1から入力された再構成された残差値に加えることができ、再構成された画素ブロックデータを出力することができる。
インループフィルタ930は、再構成された画素ブロックデータに対して様々なフィルタリング動作を実行することができる。図示したように、インループフィルタ930は、デブロッキングフィルタ932及びSAOフィルタ933を含むことができる。デブロッキングフィルタ932は、再構成された画素ブロック間の継ぎ目でデータをフィルタリングし、符号化に起因して発生する画素ブロック間の不連続性を低減することができる。SAOフィルタは、SAOタイプに従って、例えば、エッジ方向/形状及び/又は画素レベルに基づいて、オフセットを画素値に加えることができる。デブロッキングフィルタ932及びSAOフィルタ933の動作は、理想的には、(図8の)符号化システム800内のそれらの相当するものの動作を模倣することになる。したがって、伝送エラー又は他の異常がない場合、復号化システム900のインループフィルタ930から得られる復号化されたフレームデータは、(図8の)符号化システム800のインループフィルタ830から得られる復号化されたフレームデータと同じであることになる。このようにして、符号化システム800及び復号化システム900は、それらの対応する予測バッファ840、940に参照ピクチャの共通の組を記憶しなければならない。
予測バッファ940は、後の他の画素ブロックの予測で使用するためにフィルタリングされた画素データを記憶することができる。予測バッファ940は、イントラ予測に使用するために、それぞれのフレームの復号化された画素ブロックデータをそれが符号化されたように記憶することができる。予測バッファ940はまた、復号化された参照フレームを記憶することができる。
説明したように、予測器950は、予測データを画素ブロック復号器920に供給することができる。予測器950は、符号化されたビデオデータストリーム内に供給される予測基準インジケータによって判定されたように、予測された画素ブロックデータを供給することができる。
コントローラ960は、復号化システム900の動作全体を制御することができる。コントローラ960は、符号化されたビデオデータストリーム内で受信したパラメータに基づいて、画素ブロック復号器920及び予測器950に対する動作パラメータを設定することができる。本説明に関連するように、これらの動作パラメータは、逆量子化器924.1〜924.N及び逆変換ユニット923に対する量子化パラメータQ1〜QN及び変換モードMを含むことができる。説明したように、受信したパラメータは、画像データの様々な粒度で、例えば、画素ごとに、画素ブロックごとに、フレームごとに、スライスごとに、LCUごとに、又は入力画像に対して定義された他の種類の領域に基づいて、設定することができる。
図8及び図9の実施形態は、いくつかの次元、図2及び図3の実施形態より多数の次元に沿った画像データの量子化を提供する。実装では、回路設計者は、それらの用途に好適な限り多くの種類の量子化器813.1〜813.N及び逆量子化器924.1〜924.Nを有する符号化及び復号化システムを設計することが簡便であると見出すことがある。符号化システム及び復号化システムの配給業者の間の協調なしには、個々の符号化システム及び復号化システムは、量子化器813.1〜813.N及び逆量子化器924.1〜924.Nの不整合な組を保有することになる可能性がある。そのような状況では、符号化システム及び復号化システムは、ビデオ符号化セッションの初期化フェーズ中にそれらの量子化器813.1〜813.N及び逆量子化器924.1〜924.Nの能力を識別するデータを交換することができる。ネゴシエーションを介して、符号化システム及び復号化システムは、任意の量子化器813.1〜813.N及び逆量子化器924.1〜924.Nを共同で共有するか否かを判定することができる。そうである場合、符号化システム及び復号化システムは、共同で共有されないそれらの量子化器813.1〜813.N及び逆量子化器924.1〜924.Nを無効にし、それらを通過状態に設定して、共同で共有されたそれらの量子化器813.1〜813.N及び逆量子化器924.1〜924.Nを用いてビデオ符号化を行なうことができる。したがって、符号化システム及び復号化システムは、それらの能力が同一でないとしても、本開示に固有の利点を実現することができる。
図10は、本開示の別の実施形態に係る符号化システム1000の機能ブロック図である。システム1000は、画素ブロック符号器1010と、画素ブロック復号器1020と、インループフィルタシステム1030と、予測バッファ1040と、予測器1050と、コントローラ1060と、シンタックスユニット1070とを含むことができる。画素ブロック符号器及び復号器1010、1020並びに予測器1050は、個々の画素ブロックに対して繰返し動作することができる。予測器1050は、新たに提示された画素ブロックの符号化中に使用するためのデータを予測することができる。画素ブロック符号器1010は、いくつかの並列符号化チェーン内で新しい画素ブロックを符号化することができ、符号化された画素ブロックデータをシンタックスユニット1070に提示することができる。画素ブロック復号器1020は、また並列復号化チェーン内で符号化された画素ブロックデータを復号化することができ、それから復号化された画素ブロックデータを生成することができる。インループフィルタ1030は、画素ブロック復号器1020によって得られた復号化された画素ブロックから組み立てられた復号化されたフレームデータに対して様々なフィルタリング動作を実行することができる。フィルタリングされたフレームデータは、予測バッファ1040に記憶することができ、後で受信した画素ブロックの予測のソースとして使用することができる。シンタックスユニット1070は、統制する符号化プロトコルに適合する符号化された画素ブロックデータからデータストリームを組み立てることができる。
画素ブロック符号器1010は、減算器1012と、それぞれが対応する量子化器1013.1、1013.2、...、又は1013.N、対応する変換ユニット1014.1、1014.2、...、又は1014.N、対応する係数量子化器1015.1、1015.2、...、又は1015.N、及び対応するエントロピ符号器1016.1、1016.2、...、又は1016.Nを含む並列符号化チェーンとを含むことができる。マルチプレクサ1017は、エントロピ符号器1016.1、1016.2、...、又は1016.Nの出力を単一の符号化されたビデオストリームにマージすることができ、このビデオストリームは、画素ブロック符号器1010からシンタックスユニット1070に出力することができる。
画素ブロック符号器1010は、減算器1012で入力データの画素ブロックを受け入れることができる。減算器1012は、予測器1050から予測された画素ブロックを受信し、それから入力画素ブロックと予測された画素ブロックとの間の画素の差を表す画素残差のアレイを生成することができる。量子化器1013.1〜1013.Nはそれぞれ、画像データの異なるドメインで受信するデータの量子化を実行することができる。繰り返しになるが、量子化された次元は、互いに直交する必要はない。変換ユニット1014.1〜1014.Nは、対応する量子化器1013.1〜1013.Nから入力されたデータに変換を適用し、画素ドメインから変換係数のドメインに入力データを変換することができる。係数量子化器1015.1〜1015.Nは、それらの対応する変換ユニット1014.1〜1014.Nから入力された変換係数の量子化を実行することができる。エントロピ符号器1016.1〜1016.Nは、例えば、可変長符号語により出力を符号化して、それらの対応する係数量子化器1015.1〜1015.Nから提示された入力データの帯域幅を低減することができる。
量子化器1013.1〜1013.Nはそれぞれ、画像データの対応するドメインで受信するデータの量子化を実行することができる。量子化器1013.1〜1013.Nは、例えば、ダウンスケーラ、残差量子化器、色成分専用の量子化器、周波数ドメイン量子化器、方向的に専用(例えば水平のみ、垂直のみ、及び両方がブレンドされた)の量子化器、輝度専用の残差スケーラなどとして提供することができる。量子化器1013.1〜1013.Nは、コントローラ1060によって供給される、提供する量子化のレベルを定義する対応する量子化パラメータに従って動作することができる。量子化パラメータは、符号化されたビットストリーム内で、明示的又は暗黙的のいずれかで、復号化システムに信号として伝えることができる。いくつかのシナリオでは、個々の量子化器1013.1、1013.2、...、1013.Nは、無効にすることができ、その場合、単に変更なしにそれらの入力データを次の量子化器に渡すことができる。2つ以上の量子化器1013.1、1013.2、...、1013.Nが無効にされる場合、いくつかの関連付けられた符号化チェーン全体を無効にすることができる。
変換ユニット1014.1〜1014.Nは、イベントが保証する様々な変換モードで動作することができる。例えば、変換ユニット1014は、DCT、DST、Walsh−Hadamard変換、Haar変換、Daubechiesウェーブレット変換などを適用するように選択することができる。更に、変換ユニット1014.1〜1014.Nは、対応する符号化チェーン内で変換スキップモード符号化が適用される場合に無効にすることができる。一実施形態では、コントローラ1060は、変換ユニット1014.1〜1014.Nによって適用されることになる符号化モードを選択することができ、この符号化モードは、チェーンごとに異なることができ、コントローラ1060は、それに応じて変換ユニット1014.1〜1014.Nを構成することができる。変換モードは、明示的又は暗黙的のいずれかで、符号化されたビデオデータ内で信号として伝えることができる。
画素ブロック復号器1020は、画素ブロック符号器1010の符号化動作を反転する復号化ユニットを含むことができる。例えば、画素ブロック復号器1020は、画素ブロック符号器1010において同じようにチェーンに配置された、係数逆量子化器1022.1〜1022.Nと、逆変換ユニット1023.1〜1023.Nと、逆量子化器1024.1〜1024.Nとを含むことができる。画素ブロック復号器1020はまた、アベレージャ1025及び加算器1026を含むことができる。
画素ブロック復号器1020の復号化チェーンは、画素ブロック符号器1010の対応する符号化チェーンの出力から入力データを取ることができる。繰り返しになるが、許容されてはいるが、画素ブロック復号器1020はエントロピ符号化が無損失のイベントであるため、エントロピ符号化されたデータのエントロピ復号化を実行する必要はない。係数逆量子化器1022.1〜1022.Nは、画素ブロック符号器1010のそれらに対応する量子化器1015.1〜1015.Nの動作を反転することができる。同様に、逆変換ユニット1023.1〜1023.N及び逆量子化器1024.1〜1024.Nは、変換ユニット1014.1〜1014.N及び量子化器1013.1〜1013.Nそれぞれの動作を反転することができる。それらは、画素ブロック符号器1010内のそれらに対応するものと同じ量子化パラメータ及び変換モードを使用することができる。量子化器1013.1〜1013.N及び係数量子化器1015の動作は、様々な点でデータを切り捨てることになる可能性があり、したがって係数逆量子化器1022.1〜1022.N及び逆量子化器1024.1〜1024.Nによって再構成された残差データは、画素ブロック符号器1010内のそれらの相当するものに提示されたデータと比較したとき、符号化誤差を有することになる可能性がある。
アベレージャ1025は、様々な復号化チェーンの出力を平均することができる。異なる符号化チェーンの寄与は、等しい重みで与えるか、あるいは、コントローラ1060によって割り当てられた重みに基づいて重み付けすることができる。一実施形態では、コントローラ1060は、異なるチェーンからの再構成されたデータの歪みを測定することができ、平均化した際にそのような歪みを低減する平均化加重を選択することができる。アベレージャ1025の出力は、再構成された残差データとして加算器1026に入力することができる。
加算器1026は、減算器1012によって実行される動作を反転することができる。加算器1026は、残差信号を生成するのに減算器1012が使用したのと同じ予測画素ブロックを予測器1050から受信することができる。加算器1026は、予測画素ブロックをアベレージャ1025によって出力された再構成された残差値に加えることができ、再構成された画素ブロックデータを出力することができる。
インループフィルタ1030は、回復した画素ブロックデータに対して様々なフィルタリング動作を実行することができる。例えば、インループフィルタ1030は、デブロッキングフィルタ1032及びSAOフィルタ1033を含むことができる。デブロッキングフィルタ1032は、再構成された画素ブロック間の継ぎ目でデータをフィルタリングし、符号化に起因して発生する画素ブロック間の不連続性を低減することができる。SAOフィルタ1033は、SAOタイプに従って、例えば、エッジ方向/形状及び/又は画素レベルに基づいて、オフセットを画素値に加えることができる。インループフィルタ1030は、コントローラ1060によって選択されたパラメータに従って動作することができる。
予測バッファ1040は、後の他の画素ブロックの予測で使用するためにフィルタリングされた画素データを記憶することができる。異なる予測モードに対して異なる種類の予測データが、予測器1050にて利用可能になる。例えば、入力画素ブロックに対して、イントラ予測は、入力画素ブロックが配置された同じフレームの復号化されたデータから予測基準を取る。したがって、予測バッファ1040は、それぞれのフレームの復号化された画素ブロックデータをそれが符号化されたように記憶することができる。同じ入力画素ブロックに対して、インター予測は、参照フレームとして指定された前に符号化され復号化されたフレーム(単数又は複数)から予測基準を取ることができる。したがって、予測バッファ1040は、これらの復号参照フレームを記憶することができる。
説明したように、予測器1050は、残差を生成するために使用する予測データを画素ブロック符号器1010に供給することができる。予測器1050は、インタ予測器1052と、イントラ予測器1053と、モード決定ユニット1054とを含むことができる。インター予測器1052は、符号化されることになる新しい画素ブロックを表す画素ブロックデータを受信することができ、入力画素ブロックを符号化するのに使用するために参照フレーム(単数又は複数)から画素ブロックデータに対して予測バッファ1040を検索することができる。インター予測器1052は、1つ又は1対の参照フレームから予測データを供給する、P及びBモードなどの複数の予測モードをサポートすることができる。インター予測器1052は、インタ予測モードを選択し、符号化される入力画素ブロックに対する最も近い一致を提供する予測データを供給することができる。インター予測器1052は、動きベクトルなどの予測基準インジケータを生成し、どの参照フレームのどの部分(単数又は複数)が入力画素ブロックに対する予測のソース(単数又は複数)として選択されたかを識別することができる。
イントラ予測器1053は、イントラ符号化をサポートすることができる。イントラ予測器1053は、入力画素ブロックに対する最も近い一致を提供する符号化される画素ブロックと同じフレームからの符号化された画素ブロックデータの中から検索することができる。イントラ予測器1053はまた、予測基準インジケータを生成し、フレームのどの部分が入力画素ブロックに対する予測のソースとして選択されたかを識別することができる。
モード決定ユニット1054は、入力画素ブロックに適用されることになる最終の符号化モードを選択することができる。典型的には、モード決定ユニット1054は、ビデオが復号化されたときに最も小さい歪みを実現することになる予測モードを選択する。ランダムアクセス又はデータ更新ポリシーをサポートすることなどの、符号化システム1000が準拠する他のポリシーを満たすように符号化モードが選択される場合に、例外が発生することがある。モード決定ユニット1054は、予測データを画素ブロック符号器及び復号器1010、1020に出力することができ、選択されたモードに対応する予測基準インジケータとともに選択された予測モードの識別をコントローラ1060に供給することができる。
コントローラ1060は、符号化システム1000の動作全体を制御することができる。コントローラ1060は、入力画素ブロック、並びにまた符号化ビットレート目標及び他の動作パラメータなどの外部制約条件の分析に基づいて、画素ブロック符号器1010及び予測器1050に対する動作パラメータを選択することができる。本説明に関連するように、コントローラが、量子化器1013.1〜1013.Nによって使用されることになる量子化パラメータ及び変換モードを選択するとき、それらのパラメータをシンタックスユニット1070に提供することができ、シンタックスユニット1070は、それらのパラメータを表すデータをシステム1000によって出力される符号化されたビデオデータのデータストリームに含めることができる。コントローラ1060はまた、1つ以上の量子化器ユニット(例えば、量子化器1013.2)によって量子化を適用すべきでないことを判定することができ、その場合、コントローラ1060は、量子化器1013.2を無効にすることができる。上述したように、コントローラ1060はまた、変換ユニット1014の動作モードを判定することができる。
説明したように、量子化パラメータは画素ブロックの全ての画素に一様に適用される単一の値として提供される必要はなく、代わりに、その値がそれぞれの画素位置で変化する量子化パラメータの対応するアレイとして提供することができる。一実施形態では、様々な量子化器アレイは、所定のプロトコルに従って、それぞれが異なる画素位置で対応する量子化値を有するように定義することができる。動作中、コントローラ1060は、インデックス又は他の識別子を提供することにより、どのアレイを使用するかを識別することができる。
別の実施形態では、(単一の値又は値のアレイであろうと)量子化パラメータは画像データの特性から導出することができる。例えば、量子化パラメータは、画素残差に対応する予測画素値の強度に基づいて選択することができる。この場合では、量子化パラメータの値は、予測器の強度値に従ってあらゆる画素に対して異なることができ、例えば、より小さな予測器の値を有するサンプルより、より大きな予測器の値を有するサンプルに対してより高くてもよい。これらの量子化パラメータは、線形、すなわちスケーラ,定式化、又はより複雑な非線形/非一様な定式化を用いて定義することができる。
一実施形態では、量子化器は、q(i,j)=fk(p(i,j),i,j)の形式の所定の関数によって表すことができ、式中、qは、問題の量子化器を表し、i及びjは、量子化される画素ブロック内の値(画素ドメインの値又は変換ドメインの値のいずれか)の位置を表し、p(i,j)は、量子化される画素強度値を表し、fkは、qに対するp、i、及びjに関する関数を表す。シグナリングの一部として、コントローラ1060は、使用されている関数を識別するデータ、及び対応する関数が機能する任意の他のデータ(例えば、対応する関数で機能することができる任意のスケーラ及びオフセット)を提供することができる。
量子化プロセスはまた、ルックアップテーブル形式(図示せず)を用いて指定することができる。ルックアップテーブル形式は、ルックアップテーブルに含まれていない特定の値の量子化/逆量子化プロセスを判定する補間技術の使用を伴うことができる。あるいは、量子化パラメータは、前に符号化された隣接する画素ブロックの量子化パラメータから予測することができる。更なる実施形態では、量子化パラメータの第1の組は、符号化系列のより高いレベルの構造(例えば、フレーム又はスライスヘッダ)で信号として伝えることができ、量子化パラメータの信号として伝えられた組に対する変更は、構造の画素ブロックが符号化される際に画素ブロックごとに信号として伝えることができる。
動作中、コントローラ1060は、量子化器1013、1014、及び1015並びに変換ユニット1014の動作パラメータを画像データの異なる粒度で、画素ブロックごと又はより大きな粒度、例えば、フレームごと、スライスごと、LCUごと、又は別の領域、のいずれかで修正することができる。一実施形態では、量子化パラメータは、画素ごとに修正することができる。
加えて、説明したように、コントローラ1060は、インループフィルタ1030及び予測器1050の動作を制御することができる。そのような制御としては、予測器1050に対してはモード選択(ラムダ、テストされることになるモード、検索ウィンドウ、歪み戦略など)、及びインループフィルタ1030に対してはフィルタパラメータの選択、パラメータの並べ替え、加重予測などを挙げることができる。
図11は、本開示の一実施形態に係る復号化システム1100の機能ブロック図である。復号化システム1100は、シンタックスユニット1110と、画素ブロック復号器1120と、インループフィルタ1130と、予測バッファ1140と、予測器1150と、コントローラ1160と含むことができる。シンタックスユニット1110は、符号化されたビデオデータストリームを受信することができ、符号化されたデータをその成分部分に解析することができる。符号化パラメータを表すデータは、コントローラ1160に提出することができ、符号化された残差を表すデータ(図10の画素ブロック符号器1010によって出力されたデータ)は、画素ブロック復号器1120に提出することができる。画素ブロック復号器1120は、(図10の)画素ブロック符号器1010によって提供される符号化動作を反転することができる。インループフィルタ1130は、再構成された画素ブロックデータをフィルタリングすることができる。再構成された画素ブロックデータは、表示のためにフレームに組み立てて、復号化システム1100から出力ビデオとして出力することができる。フレームはまた、予測動作に使用するために予測バッファ1140に記憶することができる。予測器1150は、符号化されたビデオデータストリーム内で受信した符号化データによって判定されたように、予測データを画素ブロック復号器1120に供給することができる。
画素ブロック復号器1120は、エントロピ復号器1121と、デマルチプレクサ1122と、複数の係数逆量子化器1123.1〜1123.Nと、複数の逆変換ユニット1124.1〜1124.Nと、複数の逆量子化器1125.1〜1125.Nと、アベレージャ1126と、加算器1127とを含むことができる。エントロピ復号器1121は、エントロピ復号化を実行し、(図10の)エントロピ符号器1016によって実行されるプロセスを反転することができる。デマルチプレクサ1122は、(図10の)画素ブロック符号器1010の対応するチェーンからの符号化されたビデオデータを画素ブロック復号器1120内の対応する復号化チェーンに送信することができる。それぞれの係数逆量子化器1123.1、1123.2、...、1123.Nは、(図10の)画素ブロック符号器1010の対応する係数量子化器1015.1、1015.2、...、1015.Nの動作を反転することができる。同様に、逆変換ユニット1124.1、1124.2、...、1124.N及び逆量子化器1125.1、1125.2、...、1125.Nは、(図10の)画素ブロック符号器1010からのそれらの対応するユニットそれぞれの動作を反転することができる。それらは、符号化されたビデオデータストリーム内で提供される量子化パラメータを使用することができる。量子化器1013.1〜1013.N及び係数量子化器1015.1〜1015.Nの動作は、様々な点でデータを切り捨てるため、係数逆量子化器1123.1、1123.2、...、1123.N及び逆量子化器1125.1〜1125.Nによって再構成された残差データは、(図10の)画素ブロック符号器1010内のそれらに対応するものに提示された入力データと比較したとき、符号化誤差を保有することになる可能性がある。
アベレージャ1126は、様々な復号化チェーンの出力を平均することができる。異なる復号化チェーンの寄与は、等しい重みで与えるか、あるいは、符号化されたビデオデータから得られる、コントローラ1160によって割り当てられた重みに基づいて重み付けすることができる。アベレージャ1126の出力は、再構成された残差データとして加算器1127に入力することができる。
加算器1127は、(図10の)減算器1012によって実行される動作を反転することができる。加算器は、符号化されたビデオデータストリーム内の予測基準によって判定されたように、予測器1150から予測画素ブロックを受信することができる。加算器1127は、予測画素ブロックをアベレージャ1126から入力された再構成された残差値に加えることができる。
インループフィルタ1130は、再構成された画素ブロックデータに対して様々なフィルタリング動作を実行することができる。図示したように、インループフィルタ1130は、デブロッキングフィルタ1132及びSAOフィルタ1133を含むことができる。デブロッキングフィルタ1132は、再構成された画素ブロック間の継ぎ目でデータをフィルタリングし、符号化に起因して発生する画素ブロック間の不連続性を低減することができる。SAOフィルタは、SAOタイプに従って、例えば、エッジ方向/形状及び/又は画素レベルに基づいて、オフセットを画素値に加えることができる。デブロッキングフィルタ1132及びSAOフィルタ1133の動作は、理想的には、(図10の)符号化システム1000内のそれらに対応するものの動作を模倣することになる。したがって、伝送エラー又は他の異常がない場合、復号化システム1100のインループフィルタ1130から得られる復号化されたフレームデータは、(図10の)符号化システム1000のインループフィルタ1030から得られる復号化されたフレームデータと同じになる。このようにして、符号化システム1000及び復号化システム1100は、それらの対応する予測バッファ1040、1140に参照ピクチャの共通の組を記憶しなければならない。
予測バッファ1140は、後の他の画素ブロックの予測で使用するためにフィルタリングされた画素データを記憶することができる。予測バッファ1140は、イントラ予測に使用するために、それぞれのフレームの復号化された画素ブロックデータをそれが符号化されたように記憶することができる。予測バッファ1140はまた、復号化された参照フレームを記憶することができる。
説明したように、予測器1150は、予測データを画素ブロック復号器1120に供給することができる。予測器1150は、符号化されたビデオデータストリーム内に供給される予測基準インジケータによって判定されたように、予測された画素ブロックデータを供給することができる。
コントローラ1160は、符号化システム1100の動作全体を制御することができる。コントローラ1160は、符号化されたビデオデータストリーム内で受信したパラメータに基づいて、画素ブロック復号器1120及び予測器1150に対する動作パラメータを設定することができる。本説明に関連するように、これらの動作パラメータは、逆変換ユニット1123に対する量子化パラメータ及び変換モードを含むことができる。説明したように、受信したパラメータは、画像データの様々な粒度で、例えば、画素ブロックごとに、フレームごとに、スライスごとに、LCUごとに、又は入力画像に対して定義された別の領域に基づいて、設定することができる。
図10及び図11の実施形態は、いくつかの次元、図2及び図3の実施形態より多数の次元に沿った画像データの量子化を提供する。図8及び図9の実施形態と同様に、図10及び図11の符号化システム及び復号化システムは、符号化システム及び復号化システムが同一の量子化器能力を有さない場合でも、本説明に固有の利点を実現することができる。
更に、図10の実施形態は、符号化システムに符号化中に特定の量子化技術をテストし符号化品質と帯域幅との対話を査定する機会を提供する。符号化の後に続いて、図10の符号化システム1000は、所与の符号化チェーンの結果がよくないことを判定することができる。そのような判定に応じて、符号化システムは、対応する符号化チェーンの重みWを0に設定し、そのチェーンの符号化されたデータを符号化されたビデオデータストリームから除外することができる。
説明したように、前述の実施形態の量子化器及び逆量子化器の動作は、符号化されその後復号化されるそれぞれの画素ブロックに対して再構成することができる。したがって、単一の画像は、量子化動作の幅広いアレイに従うことができる。図12及び図13は、フレームに対する量子化の例示的な選択を示す。
また説明したように、所与のフレームに対する量子化モードの選択は、異なる粒度で行うことができる。例えば、符号化されるそれぞれの画素ブロックに対して新たに量子化モードを選択することが簡便であり得る。しかし、他の実施形態では、スライスごとに、LCUごとに、又はフレームごとに、量子化モードを選択することが簡便であり得る。
前述の説明は、本開示の各種実施形態を、それらを具現化することができる符号化システム、復号化システム、及び機能ユニットの文脈で説明した。特に、これらのシステムは、一体型のビデオカメラを備えるモバイルデバイス(例えば、カメラが使用可能な電話機、娯楽システム、及びコンピュータ)、並びに/又はビデオ会議機器及びカメラが使用可能なデスクトップコンピュータなどの有線通信システムなどの、様々なデバイスに適用することができる。いくつかの用途では、上述した機能ブロックは、一体型ソフトウェアシステムの要素として提供することができ、そこでブロックは、プログラム命令としてメモリに記憶され汎用処理システムによって実行されるコンピュータプログラムの要素として提供することができる。他の用途では、機能ブロックは、デジタル信号プロセッサ又は特定用途向け集積回路内の機能ユニットなどの、処理システムの個別の回路構成要素として提供することができる。本開示の更に他の用途は、専用のハードウェア及びソフトウェア構成要素のハイブリッドシステムとして具現化することができる。更に、本明細書で説明した機能ブロックは、別個の要素として提供される必要はない。例えば、図1〜図11では、別個のユニットとしてビデオ符号器及び復号器の構成要素を示すが、1つ以上の実施形態では、それらの一部又は全ては一体化することができ、別個のユニットである必要はない。そのような実装形態の詳細は、上記で特に明記しない限り、本開示の動作に重要ではない。
更に、本明細書で示した図は、本開示の主題を提示するために必要な限りの詳細のみを提供している。特に、ビデオ符号器及び復号器は、典型的には、本明細書で説明したものに加えて、例示した符号化パイプライン全体にわたってデータを記憶するバッファ、並びに通信ネットワーク及び相手先の符号器/復号器デバイスとの通信を管理する通信用送受信機を含む、機能ユニットを含むことになる。そのような要素は、明瞭にするために前述の説明からは省略されている。
本開示のいくつかの実施形態は、本明細書で具体的に図示及び/又は説明されている。しかし、本開示の改変及び変形は、本開示の趣旨及び意図された範囲から逸脱することなく、上記の教示によって網羅され、添付の特許請求の範囲内に含まれることが理解されよう。

Claims (29)

  1. ビデオ符号化の方法であって、
    入力データのアレイと予測データのアレイとの比較から画素残差を生成することと、
    前記画素残差を第1の次元で第1の量子化をすることと、
    前記量子化された画素残差を変換係数のアレイに変換することと、
    前記変換係数を第2の次元で第2の量子化をすることと、
    前記量子化された変換係数をエントロピ符号化することと、を含む、ビデオ符号化方法。
  2. 前記第1の量子化は、前記画素残差のアレイをダウンスケーリングすることを含む、請求項1に記載のビデオ符号化方法。
  3. 前記第1の量子化は、色成分によって一様に前記画素残差のアレイを量子化することを含む、請求項1に記載のビデオ符号化方法。
  4. 前記第1の量子化は、色成分によって非一様に前記画素残差のアレイを量子化することを含む、請求項1に記載のビデオ符号化方法。
  5. 前記第1の量子化は、前記画素残差の値を量子化することを含む、請求項1に記載のビデオ符号化方法。
  6. 前記第1の量子化は、前記アレイの1つの方向に沿って非一様に前記画素残差のアレイを量子化することを含む、請求項1に記載のビデオ符号化方法。
  7. 前記第1の量子化は、対応する画素の予測値の強度に基づいて非一様に値を量子化することを含む、請求項1に記載のビデオ符号化方法。
  8. 前記画素残差を第3の次元で量子化し、量子化された画素残差の第2のアレイを産出することと、
    前記量子化された画素残差の第2のアレイを変換係数の第2のアレイに変換することと、
    前記変換係数の第2のアレイを前記第2の次元で量子化することと、及び
    前記量子化された変換係数の第2のアレイをエントロピ符号化することと、を更に含む、請求項1に記載のビデオ符号化方法。
  9. 前記第1の量子化ステップと前記変換ステップとの間に、前記第1の量子化から得られるデータに別の次元で第3の量子化をすること、を更に含む、請求項1に記載のビデオ符号化方法。
  10. 前記エントロピ符号化から得られる符号化されたデータとともに、前記第1及び第2の量子化とのパラメータをチャネルに送信すること、を更に含む、請求項1に記載のビデオ符号化方法。
  11. ビデオ復号化方法であって、
    チャネルから受信した符号化されたビデオデータをエントロピ復号化し、量子化された変換係数を産出することと、
    前記量子化された変換係数を第1の次元で第1の逆量子化をし、再構成された変換係数を産出することと、
    前記再構成された変換係数を画素ドメインに変換することと、
    前記変換から得られる画素ドメインの値を第2の次元で第2の逆量子化をし、画素残差のアレイを産出することと、
    前記画素残差のアレイ及び予測データのアレイから再構成された画素値のアレイを生成することと、を含む、ビデオ復号化方法。
  12. 前記第2の逆量子化は、前記画素ドメインの値のアレイをアップスケーリングすることを含む、請求項11に記載のビデオ復号化方法。
  13. 前記第2の逆量子化は、色成分によって一様に前記画素ドメインの値のアレイを逆量子化することを含む、請求項11に記載のビデオ復号化方法。
  14. 前記第2の逆量子化は、色成分によって非一様に前記画素ドメインの値のアレイを逆量子化することを含む、請求項11に記載のビデオ復号化方法。
  15. 前記第2の逆量子化は、前記画素ドメインの値の値を逆量子化することを含む、請求項11に記載のビデオ復号化方法。
  16. 前記量子化された変換係数を前記第1の次元で第3の逆量子化をし、再構成された変換係数の第2のアレイを産出することと、
    前記再構成された変換係数の第2のアレイを前記画素ドメインに第2の変換をすることと、
    前記第2の変換から得られる画素ドメインの値の第2のアレイを別の次元で第4の逆量子化をし、画素残差のアレイの第2のアレイを産出することと、を更に含み、
    前記再構成された画素値の生成は、前記画素残差のアレイの第2のアレイに基づく、請求項11に記載のビデオ復号化方法。
  17. 前記変換ステップと前記第2の逆量子化ステップとの間に、前記変換するステップから得られるデータを前記第2の次元とは別個の別の次元で第3の量子化をすること、を更に含む、請求項11に記載のビデオ復号化法。
  18. 前記第1及び第2の逆量子化ステップのパラメータがチャネルで受信される、請求項11に記載のビデオ復号化法。
  19. ビデオ符号化器であり、
    符号化されることになるデータ及び予測データそれぞれのための入力を有する減算器と、
    前記減算器の出力と通信する入力を有する第1の量子化器と、
    前記第1の量子化器の出力と通信する入力を有する変換ユニットと、
    前記変換ユニットの出力と通信する入力を有する第2の量子化器であって、前記第1及び第2の量子化器が符号化されることになるデータの異なる特性を量子化するように動作可能で、及び
    前記第2の量子化器の出力と通信する入力を有するエントロピ符号器と、を備える、ビデオ符号器。
  20. 前記第1の量子化器と前記変換ユニットとの間の通信経路内に設けられた第3の量子化器を更に備え、前記第3の量子化器が、前記第1及び第2の量子化器とは、符号化されることになるデータの異なる特性を量子化するように動作可能な、請求項19に記載のビデオ符号器。
  21. 前記第1の量子化器、変換ユニット、第2の量子化器、及びエントロピ符号器が、第1の符号化チェーンを形成し、
    前記ビデオ符号器は少なくとも1つの他の符号化チェーンを備え、
    前記減算器の出力と通信する入力を有する第3の量子化器と、
    前記第3の量子化器の出力と通信する入力を有する第2の変換ユニットと、
    前記第2の変換ユニットの出力と通信する入力を有する第4の量子化器であって、前記第3及び第4の量子化器が符号化されることになるデータの異なる特性を量子化するように動作可能で、及び、
    前記第4の量子化器の出力と通信する入力を有する第2のエントロピ符号器と、を含む、請求項19に記載のビデオ符号器。
  22. 前記第1の量子化器が、ダウンスケーラである、請求項19に記載のビデオ符号器。
  23. 前記第1の量子化器が、色成分に基づく量子化器である、請求項19に記載のビデオ符号器。
  24. 前記減算器は、入力画素ブロックに割り当てられた予測モードに基づいて無効にすることができる、請求項19に記載のビデオ符号器。
  25. ビデオ符号器であり
    符号化されたビデオデータのための入力を有するエントロピ復号器と、
    前記エントロピ復号器の出力と通信する入力を有する第1の逆量子化器と、
    前記第1の逆量子化器の出力と通信する入力を有する変換ユニットと、
    前記変換ユニットの出力と通信する入力を有する第2の逆量子化器であって、前記第1及び第2の逆量子化器が復号化されることになるデータの異なる特性を逆量子化するように動作可能で、及び
    前記第2の逆量子化器の出力と通信する第1の入力及び予測データのための第2の入力を有する加算器と、を備える、ビデオ符号器。
  26. 前記変換ユニットと前記第2の逆量子化器との間の通信経路内に設けられた第3の逆量子化器を更に備え、前記第3の量子化器が、前記第1及び第2の逆量子化器とは、復号化されることになるデータの異なる特性を逆量子化するように動作可能な、請求項25に記載のビデオ復号器。
  27. 前記エントロピ復号器、第1の逆量子化器、変換ユニット、及び第2の逆量子化器が、第1の復号化チェーンを形成し、
    前記ビデオ復号器は少なくとも1つの他の復号化チェーンを備え、
    前記符号化されたビデオデータのための入力を有する第2のエントロピ復号器と、
    前記第2のエントロピ復号器の出力と通信する入力を有する第3の逆量子化器と、
    前記第3の逆量子化器の出力と通信する入力を有する第2の変換ユニットと、
    前記第2の変換ユニットの出力と通信する入力を有する第4の逆量子化器とを含み、前記第3及び第4の逆量子化器が復号化されることになるデータの異なる特性を逆量子化するように動作可能な、請求項25に記載のビデオ復号器。
  28. 前記第2の逆量子化器がアップスケーラである、請求項25に記載のビデオ復号器。
  29. 前記第2の逆量子化器が色成分に基づく逆量子化器である、請求項25に記載のビデオ復号器。
JP2019511854A 2016-08-29 2017-07-27 ビデオ符号化/復号化システムのための多次元量子化技術 Active JP6780097B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US15/250,608 2016-08-29
US15/250,608 US11153594B2 (en) 2016-08-29 2016-08-29 Multidimensional quantization techniques for video coding/decoding systems
PCT/US2017/044208 WO2018044441A1 (en) 2016-08-29 2017-07-27 Multidimensional quantization techniques for video coding/decoding systems

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2020173397A Division JP7063965B2 (ja) 2016-08-29 2020-10-14 ビデオ符号化/復号化システムのための多次元量子化技術

Publications (2)

Publication Number Publication Date
JP2019528651A true JP2019528651A (ja) 2019-10-10
JP6780097B2 JP6780097B2 (ja) 2020-11-04

Family

ID=59523327

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2019511854A Active JP6780097B2 (ja) 2016-08-29 2017-07-27 ビデオ符号化/復号化システムのための多次元量子化技術
JP2020173397A Active JP7063965B2 (ja) 2016-08-29 2020-10-14 ビデオ符号化/復号化システムのための多次元量子化技術

Family Applications After (1)

Application Number Title Priority Date Filing Date
JP2020173397A Active JP7063965B2 (ja) 2016-08-29 2020-10-14 ビデオ符号化/復号化システムのための多次元量子化技術

Country Status (7)

Country Link
US (2) US11153594B2 (ja)
EP (1) EP3488609A1 (ja)
JP (2) JP6780097B2 (ja)
KR (4) KR102438062B1 (ja)
CN (2) CN114222122A (ja)
BR (1) BR112019004035A2 (ja)
WO (1) WO2018044441A1 (ja)

Families Citing this family (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10999602B2 (en) 2016-12-23 2021-05-04 Apple Inc. Sphere projected motion estimation/compensation and mode decision
US11259046B2 (en) 2017-02-15 2022-02-22 Apple Inc. Processing of equirectangular object data to compensate for distortion by spherical projections
US10924747B2 (en) 2017-02-27 2021-02-16 Apple Inc. Video coding techniques for multi-view video
US11093752B2 (en) 2017-06-02 2021-08-17 Apple Inc. Object tracking in multi-view video
US10754242B2 (en) 2017-06-30 2020-08-25 Apple Inc. Adaptive resolution and projection format in multi-direction video
US20190005709A1 (en) * 2017-06-30 2019-01-03 Apple Inc. Techniques for Correction of Visual Artifacts in Multi-View Images
CN112236995B (zh) 2018-02-02 2024-08-06 苹果公司 基于多假设运动补偿技术的视频编码、解码方法及编码器、解码器
US11924440B2 (en) 2018-02-05 2024-03-05 Apple Inc. Techniques of multi-hypothesis motion compensation
WO2019238008A1 (en) 2018-06-11 2019-12-19 Mediatek Inc. Method and apparatus of bi-directional optical flow for video coding
EP3834416A4 (en) 2018-08-17 2022-08-17 HFI Innovation Inc. METHODS AND APPARATUS FOR VIDEO PROCESSING WITH BIDIRECTIONAL PREDICTION IN VIDEO CODING SYSTEMS
US10986339B2 (en) * 2019-02-08 2021-04-20 Tencent America LLC Method and apparatus for harmonization between transform skip mode and multiple transform selection
KR20200143298A (ko) * 2019-06-14 2020-12-23 한국전자통신연구원 양자화 행렬 부호화/복호화 방법, 장치 및 비트스트림을 저장한 기록 매체
CN116347079A (zh) 2020-04-08 2023-06-27 日本放送协会 编码装置、解码装置及程序
JP2021177628A (ja) * 2020-05-07 2021-11-11 ブラックマジック デザイン ピーティーワイ リミテッドBlackmagic Design Pty Ltd 変換係数処理方法
WO2022174478A1 (zh) * 2021-02-22 2022-08-25 浙江大学 编码方法、解码方法、编码器、解码器及存储介质
CN115174908B (zh) * 2022-06-30 2023-09-15 北京百度网讯科技有限公司 视频编码的变换量化方法、装置、设备以及存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007528675A (ja) * 2004-03-09 2007-10-11 トムソン リサーチ ファンディング コーポレイション Avc用解像度低下更新モード
WO2011013192A1 (ja) * 2009-07-27 2011-02-03 株式会社東芝 画像符号化方法および画像復号方法
JP2012169762A (ja) * 2011-02-10 2012-09-06 Sony Corp 画像符号化装置と画像復号化装置およびその方法とプログラム
JP2015508250A (ja) * 2012-01-19 2015-03-16 マグナム セミコンダクター, インコーポレイテッド 適応低解像度アップデートモードを提供するための方法および機器

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101371584B (zh) 2006-01-09 2011-12-14 汤姆森特许公司 提供用于多视图视频编码的降低分辨率的更新模式的方法和装置
BRPI0915061A2 (pt) * 2008-06-12 2015-10-27 Thomson Licensing métodos e aparelho para codificação e decodificação de vídeo com modo de atualização de profundidade de bit reduzido e modo de atualização de amostragem de croma reduzido
DE102010054967B4 (de) * 2010-12-08 2014-08-28 Schott Ag Borfreies Universalglas und dessen Verwendung
US9066070B2 (en) * 2011-04-25 2015-06-23 Dolby Laboratories Licensing Corporation Non-linear VDR residual quantizer
SG10201710075SA (en) * 2012-05-14 2018-01-30 Luca Rossato Decomposition of residual data during signal encoding, decoding and reconstruction in a tiered hierarchy
JPWO2014050676A1 (ja) * 2012-09-28 2016-08-22 ソニー株式会社 画像処理装置および方法
GB2516022A (en) 2013-07-05 2015-01-14 Canon Kk Method, device, and computer program for processing high bit-depth content in video encoder and decoder
US9648332B2 (en) 2013-10-28 2017-05-09 Qualcomm Incorporated Adaptive inter-color component residual prediction
CN111526350B (zh) 2014-02-25 2022-04-05 苹果公司 自适应视频处理
WO2017138352A1 (en) * 2016-02-08 2017-08-17 Sharp Kabushiki Kaisha Systems and methods for transform coefficient coding

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007528675A (ja) * 2004-03-09 2007-10-11 トムソン リサーチ ファンディング コーポレイション Avc用解像度低下更新モード
WO2011013192A1 (ja) * 2009-07-27 2011-02-03 株式会社東芝 画像符号化方法および画像復号方法
JP2012169762A (ja) * 2011-02-10 2012-09-06 Sony Corp 画像符号化装置と画像復号化装置およびその方法とプログラム
JP2015508250A (ja) * 2012-01-19 2015-03-16 マグナム セミコンダクター, インコーポレイテッド 適応低解像度アップデートモードを提供するための方法および機器

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
SUKHEE CHO ET AL.: "Reisdual-downsampled stereoscopic video coding for mobile 3DTV service", JOINT VIDEO TEAM (JVT) OF ISO/IEC MPEG & ITU-T VCEG (ISO/IEC JTC 1/SC 29/WG 11 AND ITU-T SG 16 Q.6), JPN6020003801, October 2007 (2007-10-01), pages 1 - 14, ISSN: 0004206012 *

Also Published As

Publication number Publication date
US11539974B2 (en) 2022-12-27
KR102570859B1 (ko) 2023-08-25
KR20210010651A (ko) 2021-01-27
US20220103851A1 (en) 2022-03-31
CN109644270B (zh) 2022-01-18
US11153594B2 (en) 2021-10-19
CN114222122A (zh) 2022-03-22
KR20210134423A (ko) 2021-11-09
JP6780097B2 (ja) 2020-11-04
EP3488609A1 (en) 2019-05-29
CN109644270A (zh) 2019-04-16
KR102319987B1 (ko) 2021-11-02
KR20190030230A (ko) 2019-03-21
WO2018044441A1 (en) 2018-03-08
KR20220123337A (ko) 2022-09-06
JP7063965B2 (ja) 2022-05-09
US20180063544A1 (en) 2018-03-01
BR112019004035A2 (pt) 2019-05-28
KR102207146B1 (ko) 2021-01-26
JP2021036676A (ja) 2021-03-04
KR102438062B1 (ko) 2022-08-31

Similar Documents

Publication Publication Date Title
JP7063965B2 (ja) ビデオ符号化/復号化システムのための多次元量子化技術
US20180091812A1 (en) Video compression system providing selection of deblocking filters parameters based on bit-depth of video data
KR20180099614A (ko) 색차 성분 양자화 매개 변수 결정 방법 및 이러한 방법을 사용하는 장치
EP1877959A2 (en) System and method for scalable encoding and decoding of multimedia data using multiple layers
KR20220121231A (ko) 인트라 예측 모드 스케일러블 코딩 방법 및 장치
KR20140122189A (ko) 계층 간 결합된 화면 내 예측을 이용한 영상 부호화/복호화 방법 및 그 장치
JP2022515799A (ja) ビデオ復号の方法および装置、並びにプログラム
KR20130035900A (ko) 인프라스트럭쳐 성능들 및 현재 조건들에 기초한 비디오 코딩 서브-블록 사이징
KR20210128494A (ko) 인트라 모드 코딩을 위한 방법 및 시스템
KR20130035927A (ko) 적응적 업스트림 및 다운스트림 트랜스코드 조정 기능을 갖는 스트리밍 트랜스코더
CN113225558B (zh) 平滑定向和dc帧内预测
JP2023546962A (ja) 成分間のブロック終了フラグの符号化
US20240171742A1 (en) Multidimensional quantization techniques for video coding/decoding systems
KR20140057519A (ko) 영상 부호화 방법
KR20110087871A (ko) 인트라 모드를 이용한 쿼터 픽셀 해상도를 갖는 영상 보간 방법 및 장치
KR20180113868A (ko) 카메라 영상의 복호화 정보 기반 영상 재 부호화 방법 및 이를 이용한 영상 재부호화 시스템
BR122024003514A2 (pt) Método de decodificação de vídeo, decodificador de vídeo, e memória legível por computador
KR20240004995A (ko) 스킵 변환 플래그 코딩
KR20230152733A (ko) 이웃 루마 샘플들을 사용하는 루마로부터의 크로마 예측
KR20140057518A (ko) 영상 복호화 방법
CN116458159A (zh) 跳过变换标志编码
BR122024003363A2 (pt) Método de decodificação de vídeo, decodificador de vídeo, e memória legível por computador

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20190228

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20200123

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20200203

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20200501

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200612

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20200914

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20201014

R150 Certificate of patent or registration of utility model

Ref document number: 6780097

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250