JP2015530830A - スケーラブルビデオ符号化における変換基準の調整 - Google Patents
スケーラブルビデオ符号化における変換基準の調整 Download PDFInfo
- Publication number
- JP2015530830A JP2015530830A JP2015530111A JP2015530111A JP2015530830A JP 2015530830 A JP2015530830 A JP 2015530830A JP 2015530111 A JP2015530111 A JP 2015530111A JP 2015530111 A JP2015530111 A JP 2015530111A JP 2015530830 A JP2015530830 A JP 2015530830A
- Authority
- JP
- Japan
- Prior art keywords
- transform
- transformation
- video
- video information
- adjusted
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/30—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/12—Selection from among a plurality of transforms or standards, e.g. selection between discrete cosine transform [DCT] and sub-band transform or selection between H.263 and H.264
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/157—Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
- H04N19/176—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/46—Embedding additional information in the video signal during the compression process
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Physics & Mathematics (AREA)
- Discrete Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
Description
[0037]図1は、本開示に記載された観点にしたがった技術を利用し得るビデオエンコーディングおよびデコーディングシステムの例を示すブロック図である。図1に示されるように、システム10は、宛先デバイス14によって後にデコードされるエンコードされたビデオデータを提供するソースデバイス12を含む。特に、ソースデバイス12は、コンピュータ可読媒体16を介して宛先デバイス14にビデオデータを提供する。ソースデバイス12と宛先デバイス14は、デスクトップコンピュータ、ノートブック(例えばラップトップ)コンピュータ、タブレットコンピュータ、セットトップボックス、いわゆる「スマート」フォン、のようなテレフォンハンドセット、いわゆる「スマート」パッド、テレビジョン、カメラ、ディスプレイデバイス、デジタル・メディア・プレーヤー、ビデオゲームコンソール、ビデオストリーミングデバイスなどを含む広範囲のデバイスのうちのいずれかを備え得る。場合によって、ソースデバイス12と宛先デバイス14は、無線通信のために装備され得る。
[0065]図2は、本開示に記載された観点にしたがった技術を実施し得るビデオエンコーダの例を示すブロック図である。ビデオエンコーダ20のユニットのうちの1つまたは複数は、本開示の技術のうちのいずれかまたは全てを実行するように構成され得る。1つの例として、変換処理ユニット52および逆変換ユニット60は、図8について下記で説明される本開示に記載された適応変換技術のうちのいずれかまたは全てを実行するように構成され得る。しかし、本開示の観点はそれに限定されることはない。いくつかの例において、本開示に記載された技術は、ビデオエンコーダ20の種々の構成要素の間で共有され得る。1つの例として、モード選択ユニット40に加えて、あるいはその代わりに、本開示に記載された技術のうちのいずれかまたは全てを実行するように構成され得る。
[0082]図3は、本開示に記載された観点にしたがった技術を実施し得るビデオデコーダの例を示すブロック図である。ビデオデコーダ30のユニットのうちの1つまたは複数は、本開示の技術のうちのいずれかまたは全てを実行するように構成され得る。1つの例として、逆変換ユニット78は、図8について下記で説明されるように、本開示に記載された適応的変換技術のうちのいずれかまたは全てを実行するように構成され得る。しかし、本開示の観点は、それに限定されるものではない。いくつかの例において、本開示に記載された技術は、ビデオデコーダ30の種々の構成要素のうちで共有され得る。いくつかの例において、ビデオデコーダ30に加えて、あるいはその代わりに、本開示に記載れた技術のうちのいずれかまたは全てを実行するように構成され得る。
[0090]多次元スケーラビリティ400の1つの例が図4に示される。例示的な実施例において、スケーラビリティは、x軸に沿って示される時間(temporal)402(または時間(time))、y軸に沿って示される空間404、およびz軸にそって示される品質406の3次元で可能になる。時間402において、時間ディメンション、7.5Hz、15Hz、または30Hzなどの様々な値を有するが、それらに限定されないフレームレートが、時間スケーラビリティ(T)によって支援され得る。空間スケーラビリティ404(S)が支援されるとき、QCIF,CIF、および4CIF、などのような異なる解像度が可能になる。それぞれ特定の空間解像度とフレームレートに関して、SNR(信号対ノイズ比、または品質、Q)層406は、ピクチャの品質を向上するために加えられ得る。一度ビデオコンテンツが、こういったスケーラブル方法でエンコードされると、抽出ツールが、アプリケーション要求にしがって、実際にもたらされたコンテンツを適合させるために用いられ得、それは、例えば、クライアントおよび/または送信チャンネルのような様々な因子またはパラメータに依存し得る。図4に示された例において、各立方体408は、同じフレームレート(時間レベル)、空間解像度、およびSNR層を有するピクチャを抱合する。より良い表示は、それらの立方体408(例えば、ピクチャ)を任意の次元402、404、406に追加することによって実現され得る。組み合わされたスケーラビリティは、2つ、3つ、またはそれ以上の可能なスケーラビリティがある場合にサポートされる。
[0095]ビデオ符号化の1つの実施例において、画像ブロックは初めに、再構成された時間的および/または空間的に隣接するブロック内の画素を用いて予測される。予測誤差(「残差」と称される場合もある)は、変換および量子化され得る。例えば、SがサイズN×Nの残差ブロックである場合、変換されたブロックKは、下記の通り、行列乗算を用いて抽出され得る。
[0097]スケーラブル符号化において、「イントラBLモード」と呼ばれる拡張層に関する特定の符号化モードがある。イントラBLモードにおいて、拡張層ブロックにおけるテクスチャは、基本層における対応する(「協置された」(co−located)と称される場合もある、例えば、同じ空間の場所に配置される)ブロックのテクスチャを用いて予測される。対応するまたは協置するブロックの1つの例が図7に示される。第1のブロック702は、基本層704のようなより低いレベルの層に配置される。第2のブロック706は、基本層704の拡張層708に配置される。第2のブロック706(「現在のブロック」または現在符号化中のブロックとも称される)は基本層ブロック702に関して協置される。基本層704におけるブロック702は、拡張層708の画像が基本層704の画像より大きいか、あるいは異なるサイズを有する場合、アップサンプルされ得る。予測誤差(例えば、残差)は変換、量子化、およびエントロピーエンコードされ得る。
[0098]上述したとおり、スケーラブルビデオ符号化の残差は、層間予測(例えば、イントラBLモードにおける予測に起因して)に起因して、非SVC符号化と比較すると異なるエネルギー分布属性を有し得る。SVC残差は、よりノイズライクであり、エネルギーは、全体またはより大きい周波数領域に広がり得る。上述したとおり、非SVCビデオ符号化とは異なり、SVCを用いると、HF構成要素はDCまたはLF構成要素より多くのエネルギーを有することが可能である。それ故に、通常の非SVCビデオ符号化に用いられる従来の方法は、スケーラブルビデオ符号化にうまく機能し得ない。変換基準調整は、SVCを実施する場合の圧縮効率を向上するのに役立つ。
[0099]実施例において、ビデオ符号化に用いられる変換行列Aは、適応的に調整される。Hは、調整後の変換行列である。関数Fは調整工程を定義するために用いられる。
[00101]例えば、調整とは、全体の基準関数を反転することを含み得る(例えば、変換基準の全てのまたはいくつかの順序を反転する)。
[00106]この実施例において、F(A)は、下記の式となる。
以下に、本願出願の当初の特許請求の範囲に記載された発明を付記する。
[C1]
ビデオ情報を符号化するように構成された装置であって、
前記装置は、
基準層と対応する拡張層に関連付けられるビデオ情報を記憶するように構成されたメモリユニットと、
前記メモリユニットと通信するプロセッサであって、
前記プロセッサは、
前記基準層と前記拡張層と関連付けられるビデオ情報に少なくとも部分的に基づいて残差ブロック情報を取得し、
前記ビデオ情報と関連付けられる変換関数に基づいて調整された変換関数を決定し、
前記調整された変換関数と前記残差ブロック情報に基づいて変換ブロックを決定する、
ように構成された、
プロセッサ、
を備える、
装置。
[C2]
前記変換関数は第1の変換行列を備え、前記第1の変換行列は1つまたは複数の行を備え、各行は1つまたは複数の変換ベースと第2の変換行列を備え、前記第2の変換行列は1つまたは複数の行を備え、各行は1つまたは複数の変換ベースを備え、そこにおいて、前記プロセッサは前記第1の変換行列と前記第2の変換行列のうちの1つまたは両方に基づいて前記調整された変換関数を決定するようにさらに構成される、C1に記載の装置。
[C3]
前記プロセッサは、前記第1の変換行列の少なくとも1つの行において前記変換ベースのうちの少なくともいくつかの順序を反転させることによって、前記調整された変換関数を決定するように構成される、C2に記載の装置。
[C4]
前記プロセッサは、前記第1の変換行列の前記行の前記順序を反転させることによって、前記調整された変換関数を決定するように構成される、C2に記載の装置。
[C5]
前記第1の変換行列、前記第2の変換行列、またはその両方は、ディスクリートコサイン変換、ディスクリートサイン変換、アダマール変換、ハール変換を備える前記グループから選択された変換に対応する、C2に記載の装置。
[C6]
前記第1の変換行列は、前記第2の変換行列の転置行列である、C2に記載の装置。
[C7]
前記プロセッサは、前記ビデオ情報に基づいて前記調整された変換関数を決定するようにさらに構成される、C1に記載の装置。
[C8]
前記ビデオ情報は、符号化ユニット(CU)モード、CUサイズ、変換ユニット(TU)サイズ、フレームタイプ、フレームサイズ、QP、時間層、および構文解析された残差係数情報のうちの1つまたは複数を備える前記グループから選択される、C7に記載の装置。
[C9]
前記構文解析された残差係数情報は、最後の非ゼロ係数の位置、非ゼロ係数の数、および1つまたは複数の係数の大きさのうちの1つまたは複数を備える前記グループから選択される、C8に記載の装置。
[C10]
前記プロセッサは、(a)前記ビデオ情報が予め決定された符号化モードに対応するか、(b)前記拡張層のQPと前記基準層のQPの間の差分が予め決定された閾値より小さいか、あるいは(a)および(b)の両方の場合のみ前記調整された変換関数を決定するように構成される、C1に記載の装置。
[C11]
前記プロセッサが、前記変換ブロックを用いて前記ビデオ情報をエンコードするようにさらに構成される、C1に記載の装置。
[C12]
前記プロセッサが、前記変換ブロックを用いて前記ビデオ情報をデコードするようにさらに構成される、C1に記載の装置。
[C13]
前記プロセッサを備えるデバイスをさらに備え、そこにおいて、前記デバイスは、デスクトップコンピュータ、ノートブックコンピュータ、ラップトップコンピュータ、タブレットコンピュータ、セットトップボックス、テレフォンハンドセット、スマートフォン、スマート・パッド、テレビジョン、カメラ、ディスプレイデバイス、デジタル・メディア・プレーヤー、ビデオゲームコンソール、またはビデオストリーミングデバイスのうちの1つ又は複数を備える前記グループから選択される、C1に記載の装置。
[C14]
ビデオ情報をデコードする方法であって、
前記方法は、
基準層と対応する拡張層に関連付けられるビデオ情報を記憶することと、
前記基準層と前記拡張層と関連付けられるビデオ情報に少なくとも部分的に基づいて残差ブロック情報を取得することと、
前記ビデオ情報と関連付けられる変換関数に基づいて調整された変換関数を決定することと、
前記調整された変換関数と前記残差ブロック情報に基づいて変換ブロックを決定することと、
前記変換ブロックを用いて前記ビデオ情報をデコードすること、
を備える、
方法。
[C15]
前記変換関数は第1の変換行列を備え、前記第1の変換行列は1つまたは複数の行を備え、各行は1つまたは複数の変換ベースと第2の変換行列を備え、前記第2の変換行列は1つまたは複数の行を備え、各行は1つまたは複数の変換ベースを備え、および前記第1の変換行列と前記第2の変換行列のうちの1つまたは両方に基づいて前記調整された変換関数を決定する、C14に記載の方法。
[C16]
前記第1の変換行列の少なくとも1つの行において前記変換ベースのうちの少なくともいくつかの順序を反転させることによって、前記調整された変換関数を決定することをさらに備える、C15に記載の方法。
[C17]
前記第1の変換行列の前記行の前記順序を反転させることによって、前記調整された変換関数を決定することをさらに備える、C15に記載の方法。
[C18]
前記第1の変換行列、前記第2の変換行列、またはその両方は、ディスクリートコサイン変換、ディスクリートサイン変換、アダマール変換、ハール変換を備える前記グループから選択された変換に対応する、C15に記載の方法。
[C19]
前記第1の変換行列は、前記第2の変換行列の転置行列である、C15に記載の方法。
[C20]
前記調整された変換関数を決定することは、前記ビデオ情報に基づく、C14に記載の方法。
[C21]
前記ビデオ情報は、符号化ユニット(CU)モード、CUサイズ、変換ユニット(TU)サイズ、フレームタイプ、フレームサイズ、QP、時間層、および構文解析された残差係数情報のうちの1つまたは複数を備える前記グループから選択される、C20に記載の方法。
[C22]
前記構文解析された残差係数情報は、最後の非ゼロ係数の位置、非ゼロ係数の数、および1つまたは複数の係数の大きさのうちの1つまたは複数を備える前記グループから選択される、C21に記載の方法。
[C23]
前記調整された変換関数を前記決定することは、(a)前記ビデオ情報が予め決定された符号化モードに対応するか、(b)前記拡張層のQPと前記基準層のQPの間の差分が予め決定された閾値より小さいか、あるいは(a)および(b)の両方の場合のみ決定される、C14に記載の方法。
[C24]
ビデオ情報をエンコードする方法であって、
前記方法は、
基準層と対応する拡張層に関連付けられるビデオ情報を記憶することと、
前記基準層と前記拡張層と関連付けられるビデオ情報に少なくとも部分的に基づいて残差ブロック情報を取得することと、
前記ビデオ情報と関連付けられる変換関数に基づいて調整された変換関数を決定することと、
前記調整された変換関数と前記残差ブロック情報に基づいて変換ブロックを決定することと、
前記変換ブロックを用いて前記ビデオ情報をエンコードすること、
を備える、
方法。
[C25]
前記変換関数は第1の変換行列を備え、前記第1の変換行列は1つまたは複数の行を備え、各行は1つまたは複数の変換ベースと第2の変換行列を備え、前記第2の変換行列は1つまたは複数の行を備え、各行は1つまたは複数の変換ベースを備え、および前記第1の変換行列と前記第2の変換行列のうちの1つまたは両方に基づいて前記調整された変換関数を決定する、C24に記載の方法。
[C26]
前記第1の変換行列の少なくとも1つの行において前記変換ベースのうちの少なくともいくつかの順序を反転させることによって、前記調整された変換関数を決定することをさらに備える、C25に記載の方法。
[C27]
前記第1の変換行列の前記行の前記順序を反転させることによって、前記調整された変換関数を決定することをさらに備える、C25に記載の方法。
[C28]
前記第1の変換行列、前記第2の変換行列、またはその両方は、ディスクリートコサイン変換、ディスクリートサイン変換、アダマール変換、ハール変換を備える前記グループから選択された変換に対応する、C25に記載の方法。
[C29]
前記第1の変換行列は、前記第2の変換行列の転置行列である、C25に記載の方法。
[C30]
前記調整された変換関数を決定することは、前記ビデオ情報に基づく、C24に記載の方法。
[C31]
前記ビデオ情報は、符号化ユニット(CU)モード、CUサイズ、変換ユニット(TU)サイズ、フレームタイプ、フレームサイズ、QP、時間層、および構文解析された残差係数情報のうちの1つまたは複数を備える前記グループから選択される、C30に記載の方法。
[C32]
前記構文解析された残差係数情報は、最後の非ゼロ係数の位置、非ゼロ係数の数、および1つまたは複数の係数の大きさのうちの1つまたは複数を備える前記グループから選択される、C31に記載の方法。
[C33]
前記調整された変換関数を前記決定することは、(a)前記ビデオ情報が予め決定された符号化モードに対応するか、(b)前記拡張層のQPと前記基準層のQPの間の差分が予め決定された閾値より小さいか、あるいは(a)および(b)の両方の場合のみ決定される、C24に記載の方法。
[C34]
ビデオ情報を符号化するための装置であって、
前記装置は、
基準層と対応する拡張層に関連付けられるビデオ情報を記憶するための手段と、
前記基準層と前記拡張層と関連付けられるビデオ情報に少なくとも部分的に基づいて残差ブロック情報を取得するための手段と、
前記ビデオ情報と関連付けられる変換関数に基づいて調整された変換関数を決定するための手段と、
前記調整された変換関数と前記残差ブロック情報に基づいて変換ブロックを決定するための手段、
を備える、
装置。
[C35]
前記調整された変換関数を決定するための前記手段は、前記ビデオ情報に基づいて前記調整された変換関数を決定するように構成される、C34に記載の装置。
[C36]
前記ビデオ情報は、符号化ユニット(CU)モード、CUサイズ、変換ユニット(TU)サイズ、フレームタイプ、フレームサイズ、QP、時間層、および構文解析された残差係数情報のうちの1つまたは複数を備える前記グループから選択される、C35に記載の装置。
[C37]
前記構文解析された残差係数情報は、最後の非ゼロ係数の位置、非ゼロ係数の数、および1つまたは複数の係数の大きさのうちの1つまたは複数を備える前記グループから選択される、C36に記載の装置。
[C38]
コンピュータで実行可能な命令を有するコンピュータ可読媒体であって、前記コンピュータで実行可能な命令は、計算デバイスによって実行される時に、
基準層と対応する拡張層に関連付けられるビデオ情報を記憶することと、
前記基準層と前記拡張層と関連付けられるビデオ情報に少なくとも部分的に基づいて残差ブロック情報を取得することと、
前記ビデオ情報と関連付けられる変換関数に基づいて調整された変換関数を決定することと、
前記調整された変換関数と前記残差ブロック情報に基づいて変換ブロックを決定すること、
を前記計算デバイスにさせる、コンピュータ可読媒体。
[C39]
前記コンピュータで実行可能な命令は、前記ビデオ情報に基づいて前記調整された変換関数を決定することを前記計算デバイスにさせる、C38に記載のコンピュータ可読媒体。
[C40]
前記ビデオ情報は、符号化ユニット(CU)モード、CUサイズ、変換ユニット(TU)サイズ、フレームタイプ、フレームサイズ、QP、時間層、および構文解析された残差係数情報のうちの1つまたは複数を備える前記グループから選択される、C39に記載のコンピュータ可読媒体。
[C41]
前記構文解析された残差係数情報は、最後の非ゼロ係数の位置、非ゼロ係数の数、および1つまたは複数の係数の大きさのうちの1つまたは複数を備える前記グループから選択される、C40に記載のコンピュータ可読媒体。
Claims (41)
- ビデオ情報を符号化するように構成された装置であって、
前記装置は、
基準層と対応する拡張層に関連付けられるビデオ情報を記憶するように構成されたメモリユニットと、
前記メモリユニットと通信するプロセッサであって、
前記プロセッサは、
前記基準層と前記拡張層と関連付けられるビデオ情報に少なくとも部分的に基づいて残差ブロック情報を取得し、
前記ビデオ情報と関連付けられる変換関数に基づいて調整された変換関数を決定し、
前記調整された変換関数と前記残差ブロック情報に基づいて変換ブロックを決定する、
ように構成された、
プロセッサ、
を備える、
装置。 - 前記変換関数は第1の変換行列を備え、前記第1の変換行列は1つまたは複数の行を備え、各行は1つまたは複数の変換ベースと第2の変換行列を備え、前記第2の変換行列は1つまたは複数の行を備え、各行は1つまたは複数の変換ベースを備え、そこにおいて、前記プロセッサは前記第1の変換行列と前記第2の変換行列のうちの1つまたは両方に基づいて前記調整された変換関数を決定するようにさらに構成される、請求項1に記載の装置。
- 前記プロセッサは、前記第1の変換行列の少なくとも1つの行において前記変換ベースのうちの少なくともいくつかの順序を反転させることによって、前記調整された変換関数を決定するように構成される、請求項2に記載の装置。
- 前記プロセッサは、前記第1の変換行列の前記行の前記順序を反転させることによって、前記調整された変換関数を決定するように構成される、請求項2に記載の装置。
- 前記第1の変換行列、前記第2の変換行列、またはその両方は、ディスクリートコサイン変換、ディスクリートサイン変換、アダマール変換、ハール変換を備える前記グループから選択された変換に対応する、請求項2に記載の装置。
- 前記第1の変換行列は、前記第2の変換行列の転置行列である、請求項2に記載の装置。
- 前記プロセッサは、前記ビデオ情報に基づいて前記調整された変換関数を決定するようにさらに構成される、請求項1に記載の装置。
- 前記ビデオ情報は、符号化ユニット(CU)モード、CUサイズ、変換ユニット(TU)サイズ、フレームタイプ、フレームサイズ、QP、時間層、および構文解析された残差係数情報のうちの1つまたは複数を備える前記グループから選択される、請求項7に記載の装置。
- 前記構文解析された残差係数情報は、最後の非ゼロ係数の位置、非ゼロ係数の数、および1つまたは複数の係数の大きさのうちの1つまたは複数を備える前記グループから選択される、請求項8に記載の装置。
- 前記プロセッサは、(a)前記ビデオ情報が予め決定された符号化モードに対応するか、(b)前記拡張層のQPと前記基準層のQPの間の差分が予め決定された閾値より小さいか、あるいは(a)および(b)の両方の場合のみ前記調整された変換関数を決定するように構成される、請求項1に記載の装置。
- 前記プロセッサが、前記変換ブロックを用いて前記ビデオ情報をエンコードするようにさらに構成される、請求項1に記載の装置。
- 前記プロセッサが、前記変換ブロックを用いて前記ビデオ情報をデコードするようにさらに構成される、請求項1に記載の装置。
- 前記プロセッサを備えるデバイスをさらに備え、そこにおいて、前記デバイスは、デスクトップコンピュータ、ノートブックコンピュータ、ラップトップコンピュータ、タブレットコンピュータ、セットトップボックス、テレフォンハンドセット、スマートフォン、スマート・パッド、テレビジョン、カメラ、ディスプレイデバイス、デジタル・メディア・プレーヤー、ビデオゲームコンソール、またはビデオストリーミングデバイスのうちの1つ又は複数を備える前記グループから選択される、請求項1に記載の装置。
- ビデオ情報をデコードする方法であって、
前記方法は、
基準層と対応する拡張層に関連付けられるビデオ情報を記憶することと、
前記基準層と前記拡張層と関連付けられるビデオ情報に少なくとも部分的に基づいて残差ブロック情報を取得することと、
前記ビデオ情報と関連付けられる変換関数に基づいて調整された変換関数を決定することと、
前記調整された変換関数と前記残差ブロック情報に基づいて変換ブロックを決定することと、
前記変換ブロックを用いて前記ビデオ情報をデコードすること、
を備える、
方法。 - 前記変換関数は第1の変換行列を備え、前記第1の変換行列は1つまたは複数の行を備え、各行は1つまたは複数の変換ベースと第2の変換行列を備え、前記第2の変換行列は1つまたは複数の行を備え、各行は1つまたは複数の変換ベースを備え、および前記第1の変換行列と前記第2の変換行列のうちの1つまたは両方に基づいて前記調整された変換関数を決定する、請求項14に記載の方法。
- 前記第1の変換行列の少なくとも1つの行において前記変換ベースのうちの少なくともいくつかの順序を反転させることによって、前記調整された変換関数を決定することをさらに備える、請求項15に記載の方法。
- 前記第1の変換行列の前記行の前記順序を反転させることによって、前記調整された変換関数を決定することをさらに備える、請求項15に記載の方法。
- 前記第1の変換行列、前記第2の変換行列、またはその両方は、ディスクリートコサイン変換、ディスクリートサイン変換、アダマール変換、ハール変換を備える前記グループから選択された変換に対応する、請求項15に記載の方法。
- 前記第1の変換行列は、前記第2の変換行列の転置行列である、請求項15に記載の方法。
- 前記調整された変換関数を決定することは、前記ビデオ情報に基づく、請求項14に記載の方法。
- 前記ビデオ情報は、符号化ユニット(CU)モード、CUサイズ、変換ユニット(TU)サイズ、フレームタイプ、フレームサイズ、QP、時間層、および構文解析された残差係数情報のうちの1つまたは複数を備える前記グループから選択される、請求項20に記載の方法。
- 前記構文解析された残差係数情報は、最後の非ゼロ係数の位置、非ゼロ係数の数、および1つまたは複数の係数の大きさのうちの1つまたは複数を備える前記グループから選択される、請求項21に記載の方法。
- 前記調整された変換関数を前記決定することは、(a)前記ビデオ情報が予め決定された符号化モードに対応するか、(b)前記拡張層のQPと前記基準層のQPの間の差分が予め決定された閾値より小さいか、あるいは(a)および(b)の両方の場合のみ決定される、請求項14に記載の方法。
- ビデオ情報をエンコードする方法であって、
前記方法は、
基準層と対応する拡張層に関連付けられるビデオ情報を記憶することと、
前記基準層と前記拡張層と関連付けられるビデオ情報に少なくとも部分的に基づいて残差ブロック情報を取得することと、
前記ビデオ情報と関連付けられる変換関数に基づいて調整された変換関数を決定することと、
前記調整された変換関数と前記残差ブロック情報に基づいて変換ブロックを決定することと、
前記変換ブロックを用いて前記ビデオ情報をエンコードすること、
を備える、
方法。 - 前記変換関数は第1の変換行列を備え、前記第1の変換行列は1つまたは複数の行を備え、各行は1つまたは複数の変換ベースと第2の変換行列を備え、前記第2の変換行列は1つまたは複数の行を備え、各行は1つまたは複数の変換ベースを備え、および前記第1の変換行列と前記第2の変換行列のうちの1つまたは両方に基づいて前記調整された変換関数を決定する、請求項24に記載の方法。
- 前記第1の変換行列の少なくとも1つの行において前記変換ベースのうちの少なくともいくつかの順序を反転させることによって、前記調整された変換関数を決定することをさらに備える、請求項25に記載の方法。
- 前記第1の変換行列の前記行の前記順序を反転させることによって、前記調整された変換関数を決定することをさらに備える、請求項25に記載の方法。
- 前記第1の変換行列、前記第2の変換行列、またはその両方は、ディスクリートコサイン変換、ディスクリートサイン変換、アダマール変換、ハール変換を備える前記グループから選択された変換に対応する、請求項25に記載の方法。
- 前記第1の変換行列は、前記第2の変換行列の転置行列である、請求項25に記載の方法。
- 前記調整された変換関数を決定することは、前記ビデオ情報に基づく、請求項24に記載の方法。
- 前記ビデオ情報は、符号化ユニット(CU)モード、CUサイズ、変換ユニット(TU)サイズ、フレームタイプ、フレームサイズ、QP、時間層、および構文解析された残差係数情報のうちの1つまたは複数を備える前記グループから選択される、請求項30に記載の方法。
- 前記構文解析された残差係数情報は、最後の非ゼロ係数の位置、非ゼロ係数の数、および1つまたは複数の係数の大きさのうちの1つまたは複数を備える前記グループから選択される、請求項31に記載の方法。
- 前記調整された変換関数を前記決定することは、(a)前記ビデオ情報が予め決定された符号化モードに対応するか、(b)前記拡張層のQPと前記基準層のQPの間の差分が予め決定された閾値より小さいか、あるいは(a)および(b)の両方の場合のみ決定される、請求項24に記載の方法。
- ビデオ情報を符号化するための装置であって、
前記装置は、
基準層と対応する拡張層に関連付けられるビデオ情報を記憶するための手段と、
前記基準層と前記拡張層と関連付けられるビデオ情報に少なくとも部分的に基づいて残差ブロック情報を取得するための手段と、
前記ビデオ情報と関連付けられる変換関数に基づいて調整された変換関数を決定するための手段と、
前記調整された変換関数と前記残差ブロック情報に基づいて変換ブロックを決定するための手段、
を備える、
装置。 - 前記調整された変換関数を決定するための前記手段は、前記ビデオ情報に基づいて前記調整された変換関数を決定するように構成される、請求項34に記載の装置。
- 前記ビデオ情報は、符号化ユニット(CU)モード、CUサイズ、変換ユニット(TU)サイズ、フレームタイプ、フレームサイズ、QP、時間層、および構文解析された残差係数情報のうちの1つまたは複数を備える前記グループから選択される、請求項35に記載の装置。
- 前記構文解析された残差係数情報は、最後の非ゼロ係数の位置、非ゼロ係数の数、および1つまたは複数の係数の大きさのうちの1つまたは複数を備える前記グループから選択される、請求項36に記載の装置。
- コンピュータで実行可能な命令を有するコンピュータ可読媒体であって、前記コンピュータで実行可能な命令は、計算デバイスによって実行される時に、
基準層と対応する拡張層に関連付けられるビデオ情報を記憶することと、
前記基準層と前記拡張層と関連付けられるビデオ情報に少なくとも部分的に基づいて残差ブロック情報を取得することと、
前記ビデオ情報と関連付けられる変換関数に基づいて調整された変換関数を決定することと、
前記調整された変換関数と前記残差ブロック情報に基づいて変換ブロックを決定すること、
を前記計算デバイスにさせる、コンピュータ可読媒体。 - 前記コンピュータで実行可能な命令は、前記ビデオ情報に基づいて前記調整された変換関数を決定することを前記計算デバイスにさせる、請求項38に記載のコンピュータ可読媒体。
- 前記ビデオ情報は、符号化ユニット(CU)モード、CUサイズ、変換ユニット(TU)サイズ、フレームタイプ、フレームサイズ、QP、時間層、および構文解析された残差係数情報のうちの1つまたは複数を備える前記グループから選択される、請求項39に記載のコンピュータ可読媒体。
- 前記構文解析された残差係数情報は、最後の非ゼロ係数の位置、非ゼロ係数の数、および1つまたは複数の係数の大きさのうちの1つまたは複数を備える前記グループから選択される、請求項40に記載のコンピュータ可読媒体。
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201261696713P | 2012-09-04 | 2012-09-04 | |
US61/696,713 | 2012-09-04 | ||
US14/014,016 US10194158B2 (en) | 2012-09-04 | 2013-08-29 | Transform basis adjustment in scalable video coding |
US14/014,016 | 2013-08-29 | ||
PCT/US2013/057618 WO2014039398A1 (en) | 2012-09-04 | 2013-08-30 | Transform basis adjustment in scalable video coding |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2015530830A true JP2015530830A (ja) | 2015-10-15 |
JP2015530830A5 JP2015530830A5 (ja) | 2016-09-29 |
JP6293756B2 JP6293756B2 (ja) | 2018-03-14 |
Family
ID=50187592
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015530111A Expired - Fee Related JP6293756B2 (ja) | 2012-09-04 | 2013-08-30 | スケーラブルビデオ符号化における変換基準の調整 |
Country Status (6)
Country | Link |
---|---|
US (1) | US10194158B2 (ja) |
EP (1) | EP2893703B1 (ja) |
JP (1) | JP6293756B2 (ja) |
KR (1) | KR20150052247A (ja) |
CN (1) | CN104604224B (ja) |
WO (1) | WO2014039398A1 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2019102888A1 (ja) * | 2017-11-24 | 2019-05-31 | ソニー株式会社 | 画像処理装置および方法 |
Families Citing this family (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2016143991A1 (ko) * | 2015-03-06 | 2016-09-15 | 한국과학기술원 | 저 복잡도 변환에 기반한 영상 부호화 및 복호화 방법 및 이를 이용하는 장치 |
WO2017138791A1 (ko) | 2016-02-12 | 2017-08-17 | 삼성전자 주식회사 | 영상 부호화 방법 및 장치, 영상 복호화 방법 및 장치 |
WO2017142085A1 (ja) | 2016-02-17 | 2017-08-24 | 日本放送協会 | 符号化装置、復号装置及びプログラム |
CN106168889B (zh) * | 2016-06-21 | 2020-11-03 | 维沃移动通信有限公司 | 一种片源编码方法以及电子设备 |
US11647214B2 (en) * | 2018-03-30 | 2023-05-09 | Qualcomm Incorporated | Multiple transforms adjustment stages for video coding |
KR102631119B1 (ko) * | 2018-04-01 | 2024-01-29 | 엘지전자 주식회사 | 축소된 2차 변환을 이용하여 비디오 신호를 처리하는 방법 및 장치 |
EP3854081A4 (en) * | 2018-09-20 | 2022-07-06 | Nokia Technologies Oy | METHOD AND APPARATUS FOR CODING AND DECODING DIGITAL IMAGE/VIDEO MATERIAL |
US11871052B1 (en) * | 2018-09-27 | 2024-01-09 | Apple Inc. | Multi-band rate control |
EP3874746A1 (en) | 2018-11-01 | 2021-09-08 | InterDigital VC Holdings, Inc. | Video encoding and decoding using multiple transform selection |
US10904563B2 (en) * | 2019-01-02 | 2021-01-26 | Tencent America LLC | Method and apparatus for improved zero out transform |
CN109788291A (zh) * | 2019-02-12 | 2019-05-21 | 北京大学 | 一种数字视频变换方法、装置、设备及存储介质 |
CN110392265B (zh) * | 2019-08-27 | 2022-03-25 | 广州虎牙科技有限公司 | 帧间运动估计方法、装置、电子设备及可读存储介质 |
CN111260022B (zh) * | 2019-11-22 | 2023-09-05 | 中国电子科技集团公司第五十二研究所 | 一种卷积神经网络全int8定点量化的方法 |
CN111950716A (zh) * | 2020-08-25 | 2020-11-17 | 云知声智能科技股份有限公司 | 一种优化int8的量化方法及系统 |
CN116156170B (zh) * | 2023-04-24 | 2024-04-16 | 北京中星微人工智能芯片技术有限公司 | 数据流的发送方法、装置、电子设备和存储介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0884081A (ja) * | 1994-07-13 | 1996-03-26 | Matsushita Electric Ind Co Ltd | デジタル符号化装置及びデジタル符号復号化装置 |
JP2010512698A (ja) * | 2006-12-14 | 2010-04-22 | トムソン ライセンシング | 適応エンハンスメントレイヤ予測を使用したビット深度スケーラブルなビデオデータを符号化及び/又は復号化する方法及び装置 |
WO2012096194A1 (ja) * | 2011-01-14 | 2012-07-19 | パナソニック株式会社 | 画像符号化方法、画像符号化装置、画像復号化方法、画像復号化装置および画像符号化復号化装置 |
JP2012165431A (ja) * | 2006-04-04 | 2012-08-30 | Qualcomm Inc | フレーム情報表を用いたフレームレベルのマルチメディア復号 |
Family Cites Families (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100186915B1 (ko) | 1994-07-13 | 1999-05-01 | 모리시다 요이치 | 디지털 부호화 장치 및 디지털 부호 복호화 장치 |
US6134270A (en) * | 1997-06-13 | 2000-10-17 | Sun Microsystems, Inc. | Scaled forward and inverse discrete cosine transform and video compression/decompression systems employing the same |
US7620252B2 (en) * | 2005-04-22 | 2009-11-17 | Hewlett-Packard Development Company, L.P. | System and method for compressing an image |
US8619860B2 (en) | 2005-05-03 | 2013-12-31 | Qualcomm Incorporated | System and method for scalable encoding and decoding of multimedia data using multiple layers |
DE602007010835D1 (de) | 2007-01-18 | 2011-01-05 | Fraunhofer Ges Forschung | Qualitätsskalierbarer videodatenstrom |
CN103281542B (zh) | 2007-06-29 | 2017-07-14 | 夏普株式会社 | 图像编码装置、图像编码方法、图像译码装置、图像译码方法 |
US8175158B2 (en) | 2008-01-04 | 2012-05-08 | Sharp Laboratories Of America, Inc. | Methods and systems for inter-layer image prediction parameter determination |
CN101466040B (zh) | 2009-01-09 | 2010-12-01 | 北京大学 | 一种用于视频编码模式决策的码率估计方法 |
KR101712097B1 (ko) * | 2009-08-19 | 2017-03-03 | 삼성전자 주식회사 | 유연한 직교 변환에 기초한 영상 부호화, 복호화 방법 및 장치 |
CN106101719B (zh) * | 2010-01-12 | 2020-06-30 | Lg电子株式会社 | 视频信号的处理方法和设备 |
CN103125116A (zh) * | 2010-09-28 | 2013-05-29 | 三星电子株式会社 | 视频编码方法和装置以及解码方法和装置 |
US9300943B2 (en) * | 2011-01-12 | 2016-03-29 | Panasonic Intellectual Property Corporation Of America | Image coding method, image decoding method, image coding apparatus, and image decoding apparatus |
BR112013031215B8 (pt) | 2011-06-10 | 2022-07-19 | Mediatek Inc | Método e aparelho de codificação escalável de vídeo |
AU2012200319B2 (en) | 2012-01-19 | 2015-11-26 | Canon Kabushiki Kaisha | Method, apparatus and system for encoding and decoding the significance map for residual coefficients of a transform unit |
US10257520B2 (en) * | 2012-06-26 | 2019-04-09 | Velos Media, Llc | Modified coding for transform skipping |
-
2013
- 2013-08-29 US US14/014,016 patent/US10194158B2/en active Active
- 2013-08-30 CN CN201380045941.0A patent/CN104604224B/zh not_active Expired - Fee Related
- 2013-08-30 KR KR1020157008569A patent/KR20150052247A/ko not_active Application Discontinuation
- 2013-08-30 WO PCT/US2013/057618 patent/WO2014039398A1/en active Application Filing
- 2013-08-30 EP EP13763374.9A patent/EP2893703B1/en active Active
- 2013-08-30 JP JP2015530111A patent/JP6293756B2/ja not_active Expired - Fee Related
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0884081A (ja) * | 1994-07-13 | 1996-03-26 | Matsushita Electric Ind Co Ltd | デジタル符号化装置及びデジタル符号復号化装置 |
JP2012165431A (ja) * | 2006-04-04 | 2012-08-30 | Qualcomm Inc | フレーム情報表を用いたフレームレベルのマルチメディア復号 |
JP2010512698A (ja) * | 2006-12-14 | 2010-04-22 | トムソン ライセンシング | 適応エンハンスメントレイヤ予測を使用したビット深度スケーラブルなビデオデータを符号化及び/又は復号化する方法及び装置 |
WO2012096194A1 (ja) * | 2011-01-14 | 2012-07-19 | パナソニック株式会社 | 画像符号化方法、画像符号化装置、画像復号化方法、画像復号化装置および画像符号化復号化装置 |
Non-Patent Citations (1)
Title |
---|
GLENN VAN WALLENDAEL, ET AL.: "Transform skipping dependant on block parameters", JOINT COLLABORATIVE TEAM ON VIDEO CODING (JCT-VC) OF ITU-T SG16 WP3 AND ISO/IEC JTC1/SC29/WG11 7TH M, vol. JCTVC-G577, JPN5015009452, 8 November 2011 (2011-11-08), ISSN: 0003676984 * |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2019102888A1 (ja) * | 2017-11-24 | 2019-05-31 | ソニー株式会社 | 画像処理装置および方法 |
JPWO2019102888A1 (ja) * | 2017-11-24 | 2020-11-19 | ソニー株式会社 | 画像処理装置および方法 |
US11445218B2 (en) | 2017-11-24 | 2022-09-13 | Sony Corporation | Image processing apparatus and method |
JP7375543B2 (ja) | 2017-11-24 | 2023-11-08 | ソニーグループ株式会社 | 画像処理装置および方法 |
Also Published As
Publication number | Publication date |
---|---|
JP6293756B2 (ja) | 2018-03-14 |
CN104604224B (zh) | 2019-05-10 |
EP2893703A1 (en) | 2015-07-15 |
US20140064361A1 (en) | 2014-03-06 |
KR20150052247A (ko) | 2015-05-13 |
EP2893703B1 (en) | 2019-05-15 |
CN104604224A (zh) | 2015-05-06 |
US10194158B2 (en) | 2019-01-29 |
WO2014039398A1 (en) | 2014-03-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6293756B2 (ja) | スケーラブルビデオ符号化における変換基準の調整 | |
TWI766844B (zh) | 針對視訊寫碼使用與位置相關之預測組合之改良視訊幀內預測 | |
US9756335B2 (en) | Optimizations on inter-layer prediction signalling for multi-layer video coding | |
EP3687169B1 (en) | Weighted prediction mode for scalable video coding | |
KR102182441B1 (ko) | 비디오 코딩에서 hevc 확장들을 위한 다중 계층들의 저복잡도 지원 | |
JP6352314B2 (ja) | 異なるアスペクト比を伴う空間スケーラビリティのためのレイヤ間の参照ピクチャの構築 | |
JP6193370B2 (ja) | 適応差分領域空間および時間参照再構成およびスムージング | |
US20130287109A1 (en) | Inter-layer prediction through texture segmentation for video coding | |
US20140064359A1 (en) | Intra prediction most probable mode order improvement for scalable video coding | |
US9648353B2 (en) | Multiple base layer reference pictures for SHVC | |
US20130329806A1 (en) | Bi-layer texture prediction for video coding | |
JP2015527811A (ja) | スケーラブル映像コーディング及び3d映像コーディングに関する一般化された残差予測 | |
JP2015514362A (ja) | ビデオ・コーディングのためのインタ・レイヤ・テクスチャ予測 | |
WO2014025698A1 (en) | Weighted difference prediction under the framework of generalized residual prediction | |
US9479788B2 (en) | Systems and methods for low complexity encoding and background detection | |
US9386306B2 (en) | Enhancement layer scan order derivation for scalable video coding |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20160805 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20160805 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20170413 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20170606 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20170808 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20171107 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20171227 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20180116 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20180214 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6293756 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |