JP2018530247A - 再編成を備えるビデオコーディングのための非分離可能2次変換 - Google Patents

再編成を備えるビデオコーディングのための非分離可能2次変換 Download PDF

Info

Publication number
JP2018530247A
JP2018530247A JP2018515971A JP2018515971A JP2018530247A JP 2018530247 A JP2018530247 A JP 2018530247A JP 2018515971 A JP2018515971 A JP 2018515971A JP 2018515971 A JP2018515971 A JP 2018515971A JP 2018530247 A JP2018530247 A JP 2018530247A
Authority
JP
Japan
Prior art keywords
block
transform
dimensional coefficient
dimensional
video
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2018515971A
Other languages
English (en)
Other versions
JP2018530247A5 (ja
JP6995744B2 (ja
Inventor
ジャオ、シン
チェン、ジャンレ
サイド、アミール
カルチェビチ、マルタ
セレジン、バディム
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Qualcomm Inc
Original Assignee
Qualcomm Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qualcomm Inc filed Critical Qualcomm Inc
Publication of JP2018530247A publication Critical patent/JP2018530247A/ja
Publication of JP2018530247A5 publication Critical patent/JP2018530247A5/ja
Application granted granted Critical
Publication of JP6995744B2 publication Critical patent/JP6995744B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/16Threshold monitoring
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/32Circuits or arrangements for control or supervision between transmitter and receiver or between image input and image output device, e.g. between a still-image camera and its memory or between a still-image camera and a printer device
    • H04N1/32101Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title
    • H04N1/32144Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title embedded in the image data, i.e. enclosed or integrated in the image, e.g. watermark, super-imposed logo or stamp
    • H04N1/32149Methods relating to embedding, encoding, decoding, detection or retrieval operations
    • H04N1/32154Transform domain methods
    • H04N1/32181Transform domain methods using Karhunen-Loeve transforms
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/12Selection from among a plurality of transforms or standards, e.g. selection between discrete cosine transform [DCT] and sub-band transform or selection between H.263 and H.264
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/12Selection from among a plurality of transforms or standards, e.g. selection between discrete cosine transform [DCT] and sub-band transform or selection between H.263 and H.264
    • H04N19/122Selection of transform size, e.g. 8x8 or 2x4x8 DCT; Selection of sub-band transforms of varying structure or type
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • H04N19/159Prediction type, e.g. intra-frame, inter-frame or bidirectional frame prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/18Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a set of transform coefficients
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/625Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using discrete cosine transform [DCT]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/182Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a pixel

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Physics & Mathematics (AREA)
  • Discrete Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

デコーダが、係数走査順序に従って第1の1次元係数ベクトルとして第1の2次元係数ブロックを再編成することと、第2の1次元係数ベクトルを生成するために第1の1次元係数ベクトルに第1の逆変換を適用することとを行うように構成される技法について説明する。第1の逆変換は、非分離可能変換である。デコーダは、第2の2次元係数ブロックとして第1の1次元係数ベクトルを再編成することと、残差ビデオブロックを生成するために第2の2次元係数ブロックに第2の逆変換を適用することとを行うようにさらに構成される。第2の逆変換は、周波数領域からピクセル領域に第2の2次元係数ブロックを変換する。デコーダは、復号ビデオブロックを形成すること、ここにおいて、復号ビデオブロックを形成することは、1つまたは複数の予測ブロックを残差ビデオブロックに加算することを備える、を行うようにさらに構成される。

Description

関連出願
[0001]本出願は、その各々の全体が参照により本明細書に組み込まれる、2015年9月29日に出願された米国仮出願第62/234,644号、2016年2月12日に出願された米国仮出願第62/294,897号、2016年4月15日に出願された米国仮出願第62/323,496号、および2016年5月17日に出願された米国仮出願第62/337,736号の利益を主張する。
[0002]本開示は、ビデオコーディングに関する。
[0003]デジタルビデオ能力は、デジタルテレビジョン、デジタルダイレクトブロードキャストシステム、ワイヤレスブロードキャストシステム、携帯情報端末(PDA)、ラップトップまたはデスクトップコンピュータ、タブレットコンピュータ、電子ブックリーダー、デジタルカメラ、デジタル記録デバイス、デジタルメディアプレーヤ、ビデオゲームデバイス、ビデオゲームコンソール、セルラー電話または衛星無線電話、いわゆる「スマートフォン」、ビデオ遠隔会議デバイス、ビデオストリーミングデバイスなどを含む、広範囲のデバイスに組み込まれ得る。デジタルビデオデバイスは、ITU−T H.261、ISO/IEC MPEG−1 Visual、ITU−T H.262またはISO/IEC MPEG−2 Visual、ITU−T H.263、ISO/IEC MPEG−4 Visual、ITU−T H.264/MPEG−4、Part 10、アドバンストビデオコーディング(AVC)、およびITU−T H.265、高効率ビデオコーディング(HEVC)によって定義された規格、およびそのような規格の拡張を含む様々な規格に記載されているビデオコーディング技法などのビデオコーディング技法を実装する。ビデオデバイスは、そのようなビデオコーディング技法を実装することによって、デジタルビデオ情報をより効率的に送信、受信、符号化、復号、および/または記憶し得る。
[0004]ビデオコーディング技法は、ビデオシーケンスに固有の冗長性を低減または除去するための空間的(ピクチャ内)予測および/または時間的(ピクチャ間)予測を含む。ブロックベースのビデオコーディングでは、ビデオスライス(たとえば、ビデオフレームまたはビデオフレームの一部分)は、ツリーブロック、コーディングユニット(CU)および/またはコーディングノードと呼ばれることもあるビデオブロックに区分され得る。ピクチャのイントラコード化(I)スライス中のビデオブロックは、同じピクチャ中の隣接ブロック中の参照サンプルに対する空間的予測を使用して符号化される。ピクチャのインターコード化(PまたはB)スライス中のビデオブロックは、同じピクチャ中の隣接ブロック中の参照サンプルに対する空間的予測、または他の参照ピクチャ中の参照サンプルに対する時間的予測を使用し得る。ピクチャは、フレームと呼ばれることがあり、参照ピクチャは、参照フレームと呼ばれることがある。
[0005]空間的予測または時間的予測により、コーディングされるべきブロックのための予測ブロックが生じる。残差データは、コーディングされるべき元のブロックと予測ブロックとの間のピクセル差分を表す。インターコーディングされたブロックは、予測ブロックを形成する参照サンプルのブロックを指す動きベクトルと、コーディングされたブロックと予測ブロックとの間の差を示す残差データとに従って符号化される。イントラコーディングされたブロックは、イントラコーディングモードと残差データとに従って符号化される。さらなる圧縮のために、残差データは、ピクセル領域から変換領域に変換され、残差変換係数が生じ得、その残差変換係数は、次いで量子化され得る。最初に2次元アレイで構成される量子化された変換係数は、変換係数の1次元ベクトルを生成するために走査され得、なお一層の圧縮を達成するために、エントロピーコーディングが適用され得る。
[0006]概して、本開示では、ビデオコーディングにおけるイントラまたはインター予測残差データに適用される2次変換設計に関する技法について説明する。変換は、HEVCの拡張または次世代のビデオコーディング規格などの高度なビデオコーデックのコンテキストにおいて使用され得る。
[0007]一例では、本開示は、第1の係数ブロックを逆量子化することと、第2の係数ブロックを生成するために逆量子化された第1の係数ブロックの少なくとも一部に第1の逆変換を適用することと、第1の逆変換は、非分離可能変換である、残差ビデオブロックを生成するために第2の係数ブロックに第2の逆変換を適用することと、第2の逆変換は、周波数領域からピクセル領域に第2の係数ブロックを変換する、復号ビデオブロックを形成することと、ここにおいて、復号ビデオブロックを形成することは、1つまたは複数の予測ブロックを残差ビデオブロックに加算することを備える、を備える方法について説明する。
[0008]一例では、本開示は、残差ビデオブロックを形成することと、ここにおいて、残差ビデオブロックを形成することは、コーディングされているビデオブロックから1つまたは複数の予測ブロックを減算することを備える、第1の係数ブロックを生成するために残差ビデオブロックに第1の変換を適用することと、第1の変換は、ピクセル領域から周波数領域に残差ビデオブロックを変換する、第2の係数ブロックを生成するために第1の係数ブロックの少なくとも一部に第2の変換を適用することと、第2の変換は、非分離可能変換である、第2の係数ブロックを量子化することとを備える方法について説明する。
[0009]一例では、本開示は、ビデオデータを復号するための装置であって、ビデオデータを記憶するように構成されたメモリと、第1の係数ブロックを逆量子化することと、第2の係数ブロックを生成するために逆量子化された第1の係数ブロックの少なくとも一部に第1の逆変換を適用することと、第1の逆変換は、非分離可能変換である、残差ビデオブロックを生成するために第2の係数ブロックに第2の逆変換を適用することと、第2の逆変換は、周波数領域からピクセル領域に第2の係数ブロックを変換する、1つまたは複数の予測ブロックを残差ビデオブロックに加算することと、1つまたは複数の予測ブロックとの残差ビデオブロックの加算に基づいて復号ビデオブロックを形成することとを行うように構成されたビデオデコーダとを備える装置について説明する。
[0010]一例では、本開示は、ビデオデータを符号化するための装置であって、ビデオデータを記憶するように構成されたメモリと、残差ビデオブロックを形成することと、ここにおいて、残差ビデオブロックを形成することは、コーディングされているビデオブロックから1つまたは複数の予測ブロックを減算することを備える、第1の係数ブロックを生成するために残差ビデオブロックに第1の変換を適用することと、第1の変換は、ピクセル領域から周波数領域に残差ビデオブロックを変換する、第2の係数ブロックを生成するために第1の係数ブロックの少なくとも一部に第2の変換を適用することと、第2の変換は、非分離可能変換である、第2の係数ブロックを量子化することとを行うように構成されたビデオエンコーダとを備える装置について説明する。
[0011]一例では、本開示は、ビデオデータを復号するための装置であって、第1の係数ブロックを逆量子化するための手段と、第2の係数ブロックを生成するために逆量子化された第1の係数ブロックの少なくとも一部に第1の逆変換を適用するための手段と、第1の逆変換は、非分離可能変換である、残差ビデオブロックを生成するために第2の係数ブロックに第2の逆変換を適用するための手段と、第2の逆変換は、周波数領域からピクセル領域に第2の係数ブロックを変換する、復号ビデオブロックを形成するための手段と、ここにおいて、復号ビデオブロックを形成するための手段は、1つまたは複数の予測ブロックを残差ビデオブロックに加算するための手段を備える、を備える装置について説明する。
[0012]一例では、本開示は、ビデオデータを符号化するための装置であって、残差ビデオブロックを形成するための手段と、ここにおいて、残差ビデオブロックを形成することは、コーディングされているビデオブロックから1つまたは複数の予測ブロックを減算することを備える、第1の係数ブロックを生成するために残差ビデオブロックに第1の変換を適用するための手段と、第1の変換は、ピクセル領域から周波数領域に残差ビデオブロックを変換する、第2の係数ブロックを生成するために第1の係数ブロックの少なくとも一部に第2の変換を適用するための手段と、第2の変換は、非分離可能変換である、第2の係数ブロックを量子化するための手段とを備える装置について説明する。
[0013]一例では、本開示は、実行されたとき、ビデオデータを復号するためのデバイスの1つまたは複数のプロセッサに、第1の係数ブロックを逆量子化することと、第2の係数ブロックを生成するために逆量子化された第1の係数ブロックの少なくとも一部に第1の逆変換を適用することと、第1の逆変換は、非分離可能変換である、残差ビデオブロックを生成するために第2の係数ブロックに第2の逆変換を適用することと、第2の逆変換は、周波数領域からピクセル領域に第2の係数ブロックを変換する、1つまたは複数の予測ブロックを残差ビデオブロックに加算することと、1つまたは複数の予測ブロックとの残差ビデオブロックの加算に基づいて復号ビデオブロックを形成することとを行わせる命令を記憶した非一時的コンピュータ可読記憶媒体について説明する。
[0014]一例では、本開示は、実行されたとき、ビデオデータを符号化するためのデバイスの1つまたは複数のプロセッサに、残差ビデオブロックを形成することと、ここにおいて、残差ビデオブロックを形成することは、コーディングされているビデオブロックから1つまたは複数の予測ブロックを減算することを備える、第1の係数ブロックを生成するために残差ビデオブロックに第1の変換を適用することと、第1の変換は、ピクセル領域から周波数領域に残差ビデオブロックを変換する、第2の係数ブロックを生成するために第1の係数ブロックの少なくとも一部に第2の変換を適用することと、第2の変換は、非分離可能変換である、第2の係数ブロックを量子化することとを行わせる命令を記憶した非一時的コンピュータ可読記憶媒体について説明する。
[0015]一例では、本開示は、ビデオデータを復号するための方法であって、係数走査順序に従って第1の1次元係数ベクトルとして第1の2次元係数ブロックを再編成することと、第2の1次元係数ベクトルを生成するために第1の1次元係数ベクトルに第1の逆変換を適用することと、第1の逆変換は、非分離可能変換である、第2の2次元係数ブロックとして第1の1次元係数ベクトルを再編成することと、残差ビデオブロックを生成するために第2の2次元係数ブロックに第2の逆変換を適用することと、第2の逆変換は、周波数領域からピクセル領域に第2の2次元係数ブロックを変換する、復号ビデオブロックを形成することと、ここにおいて、復号ビデオブロックを形成することは、1つまたは複数の予測ブロックを残差ビデオブロックに加算することを備える、を備える方法について説明する。
[0016]一例では、本開示は、ビデオデータを符号化するための方法であって、残差ビデオブロックを形成することと、ここにおいて、残差ビデオブロックを形成することは、コーディングされているビデオブロックから1つまたは複数の予測ブロックを減算することを備える、第1の2次元係数ブロックを生成するために残差ビデオブロックの少なくとも一部に第1の変換を適用することと、第1の変換は、ピクセル領域から周波数領域に残差ビデオブロックを変換する、第1の1次元係数ベクトルとして第1の2次元係数ブロックを再編成することと、第2の1次元係数ベクトルを生成するために第1の1次元係数ベクトルの少なくとも一部に第2の変換を適用することと、第2の変換は、非分離可能変換である、係数走査順序に従って第2の2次元係数ブロックとして第2の1次元係数ベクトルを再編成することとを備える方法について説明する。
[0017]一例では、本開示は、ビデオデータを復号するための装置であって、ビデオデータを記憶するように構成されたメモリと、係数走査順序に従って第1の1次元係数ベクトルとして第1の2次元係数ブロックを再編成することと、第2の1次元係数ベクトルを生成するために第1の1次元係数ベクトルに第1の逆変換を適用することと、第1の逆変換は、非分離可能変換である、第2の2次元係数ブロックとして第1の1次元係数ベクトルを再編成することと、残差ビデオブロックを生成するために第2の2次元係数ブロックに第2の逆変換を適用することと、第2の逆変換は、周波数領域からピクセル領域に第2の2次元係数ブロックを変換する、1つまたは複数の予測ブロックを残差ビデオブロックに加算することと、1つまたは複数の予測ブロックを残差ビデオブロックに加算することと、1つまたは複数の予測ブロックとの残差ビデオブロックの加算に基づいて復号ビデオブロックを形成することとを行うように構成されたビデオデコーダとを備える装置について説明する。
[0018]一例では、本開示は、ビデオデータを符号化するための装置であって、ビデオデータを記憶するように構成されたメモリと、残差ビデオブロックを形成することと、ここにおいて、残差ビデオブロックを形成することは、コーディングされているビデオブロックから1つまたは複数の予測ブロックを減算することを備える、第1の2次元係数ブロックを生成するために残差ビデオブロックの少なくとも一部に第1の変換を適用することと、第1の変換は、ピクセル領域から周波数領域に残差ビデオブロックを変換する、第1の1次元係数ベクトルを生成するために第1の2次元係数ブロックを再編成することと、第2の1次元係数ベクトルを生成するために第1の1次元係数ベクトルの少なくとも一部に第2の変換を適用することと、第2の変換は、非分離可能変換である、係数走査順序に従って第2の2次元係数ブロックとして第2の1次元係数ベクトルを再編成することとを行うように構成されたビデオエンコーダとを備える装置について説明する。
[0019]一例では、本開示は、ビデオデータを復号するための装置であって、係数走査順序に従って第1の1次元係数ベクトルとして第1の2次元係数ブロックを再編成するための手段と、第2の1次元係数ベクトルを生成するために第1の1次元係数ベクトルに第1の逆変換を適用するための手段と、第1の逆変換は、非分離可能変換である、第2の2次元係数ブロックとして第1の1次元係数ベクトルを再編成するための手段と、残差ビデオブロックを生成するために第2の2次元係数ブロックに第2の逆変換を適用するための手段と、第2の逆変換は、周波数領域からピクセル領域に第2の2次元係数ブロックを変換する、復号ビデオブロックを形成するための手段と、ここにおいて、復号ビデオブロックを形成するための手段は、1つまたは複数の予測ブロックを残差ビデオブロックに加算するための手段を備える、を備える装置について説明する。
[0020]一例では、本開示は、ビデオデータを符号化するための装置であって、残差ビデオブロックを形成するための手段と、ここにおいて、残差ビデオブロックを形成するための手段は、コーディングされているビデオブロックから1つまたは複数の予測ブロックを減算するための手段を備える、第1の2次元係数ブロックを生成するために残差ビデオブロックの少なくとも一部に第1の変換を適用するための手段と、第1の変換は、ピクセル領域から周波数領域に残差ビデオブロックを変換する、第1の1次元係数ベクトルを生成するために第1の2次元係数ブロックを再編成するための手段と、第2の1次元係数ベクトルを生成するために第1の1次元係数ベクトルの少なくとも一部に第2の変換を適用するための手段と、第2の変換は、非分離可能変換である、係数走査順序に従って第2の2次元係数ブロックとして第2の1次元係数ベクトルを再編成するための手段とを備える装置について説明する。
[0021]一例では、本開示は、実行されたとき、ビデオデータを復号するためのデバイスの1つまたは複数のプロセッサに、係数走査順序に従って第1の1次元係数ベクトルとして第1の2次元係数ブロックを再編成することと、第2の1次元係数ベクトルを生成するために第1の1次元係数ベクトルに第1の逆変換を適用することと、第1の逆変換は、非分離可能変換である、第2の2次元係数ブロックとして第1の1次元係数ベクトルを再編成することと、残差ビデオブロックを生成するために第2の2次元係数ブロックに第2の逆変換を適用することと、第2の逆変換は、周波数領域からピクセル領域に第2の2次元係数ブロックを変換する、復号ビデオブロックを形成することと、ここにおいて、復号ビデオブロックを形成することは、1つまたは複数の予測ブロックを残差ビデオブロックに加算することを備える、を行わせる命令を記憶した非一時的コンピュータ可読記憶媒体について説明する。
[0022]一例では、本開示は、実行されたとき、ビデオデータを符号化するためのデバイスの1つまたは複数のプロセッサに、コーディングされているビデオブロックから1つまたは複数の予測ブロックを減算することを備える、残差ビデオブロックを形成することと、第1の2次元係数ブロックを生成するために残差ビデオブロックの少なくとも一部に第1の変換を適用することと、第1の変換は、ピクセル領域から周波数領域に残差ビデオブロックを変換する、第1の1次元係数ベクトルを生成するために第1の2次元係数ブロックを再編成することと、第2の1次元係数ベクトルを生成するために第1の1次元係数ベクトルの少なくとも一部に第2の変換を適用することと、第2の変換は、非分離可能変換である、係数走査順序に従って第2の2次元係数ブロックとして第2の1次元係数ベクトルを再編成することとを行わせる命令を記憶した非一時的コンピュータ可読記憶媒体について説明する。
[0023]1つまたは複数の例の詳細を添付の図面および以下の説明に記載する。他の特徴、目的、および利点は、説明、図面、および特許請求の範囲から明らかになろう。
[0024]本開示で説明する技法を利用し得る例示的なビデオ符号化および復号システムを示すブロック図。 [0025]本開示で説明する技法を利用し得るHEVCにおける残差4分木に基づく変換方式の図。 [0026]ビデオエンコーダにおける変換プロセスの図。 [0027]ビデオデコーダにおける変換プロセスの図。 [0028]ビデオデコーダによって適用される例示的な回転変換の図。 [0029]2次変換係数再編成プロセスを含む例示的な符号化プロセスを示すブロック図。 [0030]2次変換係数再編成プロセスを含む例示的な復号プロセスを示すブロック図。 [0031]ルーマイントラモードから変換セットインデックスへの例示的なマッピングの図。 [0032]0〜66にわたるイントラ予測モード(IPM)範囲の図。 [0033]本開示で説明する技法を実装し得るビデオエンコーダの一例を示すブロック図。 [0034]本開示で説明する技法を実装し得るビデオデコーダの一例を示すブロック図。 [0035]本開示で説明する1つまたは複数の技法による、ビデオエンコーダによる例示的な変換処理の図。 [0036]本開示で説明する1つまたは複数の技法による、ビデオデコーダによる例示的な逆変換処理の図。 [0037]本開示で説明する技法を実施し得るビデオデータの第1の例示的な復号を示す流れ図。 [0038]本開示で説明する技法を実施し得るビデオデータの第1の例示的な符号化を示す流れ図。 [0039]本開示で説明する技法を実施し得るビデオデータの第2の例示的な復号を示す流れ図。 [0040]本開示で説明する技法を実施し得るビデオデータの第2の例示的な符号化を示す流れ図。
[0041]概して、本開示では、ビデオコーディングにおけるイントラまたはインター予測残差データに適用される2次変換設計に関する技法について説明する。変換は、HEVCの拡張または次世代のビデオコーディング規格などの高度なビデオコーデックのコンテキストにおいて使用され得る。
[0042]ビデオエンコーダは、ビデオエンコーダからビデオデコーダへの出力に好適な形態でビデオデータのための残差ブロックを表し得る。ビデオエンコーダからビデオデコーダに送信されるデータの量が低減されるように残差ブロックを表すために使用されるデータの量を低減することが望ましい。ビデオコーディングでは、分離可能変換は、非分離可能変換と比較して、より少ない演算(たとえば、加算、乗算)を使用し得るので、分離可能変換は、非分離可能変換に優先して適用されている。分離可能変換は、2つ以上のフィルタの生成物として書くことができるフィルタである。対照的に、非分離可能フィルタは、2つ以上のフィルタの生成物として書くことができない。
[0043]ピクセル領域中の残差ブロックを周波数領域中の係数ブロックに変換する変換のみに依拠するのではなく、ビデオエンコーダはまた、係数ブロックのエネルギー圧縮を増加するために2次変換を適用し得る。たとえば、2次変換は、係数ブロックのDC係数のより近くに係数ブロックの非ゼロ係数を集中し得る。したがって、係数ブロックのDC係数と係数ブロックの最後の有意な(すなわち、非ゼロ)係数との間に係数は少なく、残差ブロックを表すために使用されるデータの量が低減され得る。同様に、ビデオデコーダは、係数ブロックを残差ブロックに変換するために逆1次変換を適用し得る。このようにして、残差ブロックを表すために使用されるデータが低減され、それによって、ビデオデータのための帯域幅および/または記憶要件が低減され、潜在的に、ビデオデコーダとビデオエンコーダとのエネルギー使用量が低減され得る。
[0044]2次変換の既存の設計は、分離可能変換として2次変換を適用する。いくつかの例では、分離可能変換が非分離可能変換と比較してより低い複雑さを有するので、分離可能変換が非分離可能の代わりに適用されている。したがって、分離可能変換は、ビデオコーディング方式では、非分離可能変換よりも有利になっていることがある。しかしながら、2次変換としての非分離可能変換の使用は、改善された変換効率を与え得る。たとえば、デバイスは、分離可能2次変換よりも高速に、または少ない複雑さで、非分離可能2次変換を適用することが可能であり得る。したがって、本開示の一例によれば、ビデオデコーダは、第2の係数ブロックを生成するために逆量子化された第1の係数ブロックの少なくとも一部に第1の逆変換を適用し、第1の逆変換は、非分離可能変換であり得る。さらにこの例では、ビデオデコーダは、残差ビデオブロックを生成するために第2の係数ブロックに第2の逆変換を適用し得る。第2の逆変換は、周波数領域からピクセル領域に第2の係数ブロックを変換し得る。この例では、ビデオデコーダは、復号ビデオブロックを形成し得る。いくつかの例では、復号ビデオブロックを形成することの一部として、ビデオデコーダは、1つまたは複数の予測ブロックを残差ビデオブロックに加算し得る。
[0045]ビデオデータの圧縮の差異、たとえば、異なるイントラ予測モードは、非分離可能2次変換の有効性を変更し得る。たとえば、第1のイントラ予測モードを使用するとき、第1の非分離可能2次変換が、第2の非分離可能2次変換よりも高いエネルギー圧縮を有し得る。しかしながら、本例では、第2のイントラ予測モードを使用するとき、第2の非分離可能2次変換が、第1の非分離可能2次変換よりも高いエネルギー圧縮を有し得る。したがって、候補非分離可能2次変換のセットから候補非分離可能2次変換を選択する技法を可能にすることが望ましいことがある。すなわち、異なるビデオデータに対して同じ非分離可能2次変換を使用するのではなく、ビデオエンコーダは、非分離可能2次変換のセットから候補非分離可能2次変換を選択し得る。たとえば、ビデオエンコーダは、イントラ予測モードに基づいて非分離可能2次変換のサブセットを構築し得る。同様に、いくつかの例では、ビデオデコーダは、非分離可能2次変換のセットから候補非分離可能2次変換を選択し得る。たとえば、ビデオデコーダは、ビデオデータの復号済み情報に基づいて非分離可能2次変換のサブセットを構築し得る。このようにして、より好適な非分離可能2次変換は、残差ブロックに適用されるように選択され得、これにより、ただ1つの非分離可能2次変換候補を使用する例と比較して、残差ブロックを表すために使用されるデータの量が低減され得る。
[0046]いくつかの例では、必ずしもベクトルフォーマットで変換係数を量子化するのではなく、ビデオエンコーダは、変換係数を2次元係数ブロックに再編成し得る。より詳細には、いくつかの例では、量子化ユニットは、分離可能変換によって出力されるフォーマットであり得る2次元係数ブロックを量子化するように構成され得る。したがって、ビデオエンコーダが分離可能変換のみを使用するインスタンスならびにビデオエンコーダが分離可能変換と非分離可能変換とを使用したインスタンスにおいて、同じ量子化ユニットが使用され得る。
[0047]図1は、本開示で説明する技法を利用し得る例示的なビデオ符号化および復号システム10を示すブロック図である。図1に示すように、システム10は、宛先デバイス14によって後で復号されるべき符号化ビデオデータを提供するソースデバイス12を含む。具体的には、ソースデバイス12は、コンピュータ可読媒体16を介して宛先デバイス14にビデオデータを提供する。ソースデバイス12および宛先デバイス14は、デスクトップコンピュータ、ノートブック(すなわち、ラップトップ)コンピュータ、タブレットコンピュータ、セットトップボックス、いわゆる「スマート」フォンなどの電話ハンドセット、いわゆる「スマート」パッド、テレビジョン、カメラ、ディスプレイデバイス、デジタルメディアプレーヤ、ビデオゲームコンソール、ビデオストリーミングデバイスなどを含む、広範囲にわたるデバイスのいずれかを備え得る。場合によっては、ソースデバイス12および宛先デバイス14は、ワイヤレス通信のために装備され得る。
[0048]宛先デバイス14は、コンピュータ可読媒体16を介して復号されるべき符号化ビデオデータを受信し得る。コンピュータ可読媒体16は、ソースデバイス12から宛先デバイス14に符号化ビデオデータを移動させることが可能な任意のタイプの媒体またはデバイスを備え得る。一例では、コンピュータ可読媒体16は、ソースデバイス12が、符号化ビデオデータを宛先デバイス14にリアルタイムで直接送信することを可能にするための通信媒体を備え得る。符号化されたビデオデータは、ワイヤレス通信プロトコルなどの通信標準規格に従って変調され、宛先デバイス14に送信され得る。通信媒体は、無線周波数(RF)スペクトルまたは1つもしくは複数の物理伝送線路などの、任意のワイヤレスまたはワイヤード通信媒体を備え得る。通信媒体は、ローカルエリアネットワーク、広域ネットワーク、またはインターネットなどのグローバルネットワークなど、パケットベースのネットワークの一部を形成することができる。通信媒体は、ソースデバイス12から宛先デバイス14への通信を容易にするのに有用であり得る、ルータ、スイッチ、基地局、または任意の他の機器を含むことができる。
[0049]いくつかの例では、符号化されたデータは、出力インターフェース22からストレージデバイスに出力され得る。同様に、符号化されたデータは、入力インターフェースによってストレージデバイスからアクセスされ得る。ストレージデバイスは、ハードドライブ、Blu−ray(登録商標)ディスク、DVD、CD−ROM、フラッシュメモリ、揮発性または不揮発性メモリ、あるいは符号化されたビデオデータを記憶するための任意の他の好適なデジタル記憶媒体など、様々な分散されたまたはローカルにアクセスされるデータ記憶媒体のいずれかを含み得る。さらなる一例では、ストレージデバイスは、ソースデバイス12によって生成された符号化されたビデオを記憶し得るファイルサーバまたは別の中間ストレージデバイスに対応し得る。宛先デバイス14は、ストリーミングまたはダウンロードを介してストレージデバイスから記憶されたビデオデータにアクセスし得る。ファイルサーバは、符号化ビデオデータを記憶し、その符号化ビデオデータを宛先デバイス14に送信することが可能な任意のタイプのサーバであり得る。例示的なファイルサーバとしては、(たとえば、ウェブサイトのための)ウェブサーバ、FTPサーバ、ネットワーク接続ストレージ(NAS)デバイス、またはローカルディスクドライブがある。宛先デバイス14は、インターネット接続を含む、任意の標準のデータ接続を通して符号化ビデオデータにアクセスし得る。これは、ワイヤレスチャネル(たとえば、Wi−Fi(登録商標)接続)、ワイヤード接続(たとえば、DSL、ケーブルモデムなど)、または、ファイルサーバに記憶された符号化ビデオデータにアクセスするのに適した、両方の組合せを含み得る。ストレージデバイスからの符号化ビデオデータの送信は、ストリーミング送信、ダウンロード送信、またはそれらの組合せであり得る。
[0050]本開示の技法は、必ずしもワイヤレス適用例または設定に限定されるとは限らない。本技法は、オーバージエアテレビジョン放送、ケーブルテレビジョン送信、衛星テレビジョン送信、動的適応ストリーミングオーバーHTTP(DASH:dynamic adaptive streaming over HTTP)などのインターネットストリーミングビデオ送信、データ記憶媒体上に符号化されたデジタルビデオ、データ記憶媒体上に記憶されたデジタルビデオの復号、または他の応用など、様々なマルチメディア応用のいずれかをサポートするビデオコーディングに適用され得る。いくつかの例では、システム10は、ビデオストリーミング、ビデオ再生、ビデオブロードキャスティング、および/またはビデオテレフォニーなどの適用例をサポートするために、一方向または双方向のビデオ送信をサポートするように構成され得る。
[0051]図1の例では、ソースデバイス12は、ビデオソース18と、ビデオエンコーダ20と、出力インターフェース22とを含む。宛先デバイス14は、入力インターフェース28と、ビデオデコーダ30と、ディスプレイデバイス32とを含む。本開示によれば、ソースデバイス12のビデオエンコーダ20は、たとえば、2次変換に関係する技法など、本開示で説明する技法を適用するように構成され得る。本開示によれば、宛先デバイス14のビデオデコーダ30は、たとえば、2次変換に関係する技法など、本開示で説明する技法を適用するように構成され得る。他の例では、ソースデバイスおよび宛先デバイスは他の構成要素または構成を含み得る。たとえば、ソースデバイス12は、外部カメラなどの外部ビデオソース18からビデオデータを受信し得る。同様に、宛先デバイス14は、内蔵ディスプレイデバイスを含むのではなく、外部ディスプレイデバイスとインターフェースし得る。
[0052]上述のように、ソースデバイス12は出力インターフェース22を含み、宛先デバイス14は入力インターフェース28を含む。いくつかの例では、出力インターフェース22は送信機を表し、入力インターフェース28は受信機を表す。他の例では、出力インターフェース22および入力インターフェース28は、トランシーバ(すなわち、ワイヤレスにデータ信号を送信することと受信することの両方が可能なインターフェース)の例を表す。トランシーバは、ワイヤレス信号中でビデオデータを送信および受信するように構成され得る。たとえば、出力インターフェース22は、トランシーバとして実装されたとき、符号化ビデオデータを含むデータ信号(たとえば、コンピュータ可読媒体16)を送り得、入力インターフェース28は、トランシーバとして実装されたとき、符号化ビデオデータを含むデータ信号(たとえば、コンピュータ可読媒体16)を受信し得る。上記で説明したように、ビデオエンコーダ20は符号化ビデオデータを出力インターフェース22に与え得、入力インターフェース28は符号化ビデオデータをビデオデコーダ30に与え得る。
[0053]図1の図示のシステム10は一例にすぎない。本開示で説明する技法は、任意のデジタルビデオ符号化および/または復号デバイスによって実行され得る。概して、本開示の技法はビデオ符号化デバイスおよびビデオ復号デバイスによって実行されるが、本技法はまた、一般に「コーデック」と呼ばれるビデオエンコーダ/デコーダによって実行され得る。ソースデバイス12および宛先デバイス14は、ソースデバイス12が宛先デバイス14に送信するためのコード化ビデオデータを生成するような、コーディングデバイスの例にすぎない。いくつかの例では、デバイス12、14は、デバイス12、14の各々がビデオ符号化構成要素とビデオ復号構成要素とを含むように、実質的に対称的に動作し得る。したがって、システム10は、たとえば、ビデオストリーミング、ビデオ再生、ビデオブロードキャスティング、またはビデオテレフォニーのための、ソースデバイス12と宛先デバイス14との間の一方向または双方向のビデオ送信をサポートし得る。
[0054]ソースデバイス12のビデオソース18は、ビデオカメラ、以前にキャプチャされたビデオを含むビデオアーカイブ、および/またはビデオコンテンツプロバイダからビデオを受信するためのビデオフィードインターフェースなどの、ビデオキャプチャデバイスを含み得る。さらなる代替として、ビデオソース18は、ソースビデオとしてコンピュータグラフィックスベースのデータ、または、ライブビデオ、アーカイブされたビデオ、およびコンピュータ生成ビデオの組合せを生成し得る。場合によっては、ソースデバイス12および宛先デバイス14は、いわゆるカメラフォンまたはビデオフォンを形成し得る。ただし、上述のように、本開示で説明する技法は、概してビデオコーディングに適用可能であり得、ワイヤレスおよび/またはワイヤード適用例に適用され得る。各場合において、キャプチャされたビデオ、前にキャプチャされたビデオ、またはコンピュータ生成ビデオは、ビデオエンコーダ20によって符号化され得る。符号化ビデオ情報は、次いで、出力インターフェース22によってコンピュータ可読媒体16上に出力され得る。
[0055]コンピュータ可読媒体16は、ワイヤレスブロードキャストまたはワイヤードネットワーク送信などの一時的媒体を含み得る。いくつかの例では、ネットワークサーバ(図示せず)は、たとえば、ネットワーク送信を介して、ソースデバイス12から符号化ビデオデータを受信し、その符号化ビデオデータを宛先デバイス14に与え得る。したがって、コンピュータ可読媒体16は、様々な例において、様々な形態の1つまたは複数のコンピュータ可読媒体を含むことが理解され得る。
[0056]宛先デバイス14の入力インターフェース28はコンピュータ可読媒体16から情報を受信する。コンピュータ可読媒体16の情報は、ビデオエンコーダ20によって定義され、またビデオデコーダ30によって使用される、ブロックおよび他のコード化ユニットの特性および/または処理を記述するシンタックス要素を含む、シンタックス情報を含み得る。ディスプレイデバイス32は、復号ビデオデータをユーザに対して表示し、陰極線管(CRT)、液晶ディスプレイ(LCD)、プラズマディスプレイ、有機発光ダイオード(OLED)ディスプレイ、または別のタイプのディスプレイデバイスなど、様々なディスプレイデバイスのいずれかを備え得る。
[0057]ビデオエンコーダ20およびビデオデコーダ30はそれぞれ、1つまたは複数のマイクロプロセッサ、デジタル信号プロセッサ(DSP)、特定用途向け集積回路(ASIC)、フィールドプログラマブルゲートアレイ(FPGA)、ディスクリート論理、ソフトウェア、ハードウェア、ファームウェアなど、様々な好適なエンコーダ回路のいずれか、またはそれらの任意の組合せとして実装され得る。本技法がソフトウェアで部分的に実装されるとき、デバイスは、好適な非一時的コンピュータ可読媒体にソフトウェアのための命令を記憶し、本開示の技法を実行するために1つまたは複数のプロセッサを使用してハードウェアで命令を実行し得る。ビデオエンコーダ20およびビデオデコーダ30の各々は、1つまたは複数のエンコーダまたはデコーダ中に含まれ得、そのいずれも、それぞれのデバイスにおいて複合エンコーダ/デコーダ(コーデック)の一部として統合され得る。ビデオエンコーダ20および/またはビデオデコーダ30を含むデバイスは、集積回路、マイクロプロセッサ、および/またはセルラー電話などのワイヤレス通信デバイスを備え得る。
[0058]ビデオエンコーダ20とビデオデコーダ30とは、上記で説明した規格などのビデオコーディング規格に従って動作し、いくつかの例では、ITU−T H.265とも呼ばれる高効率ビデオコーディング(HEVC)規格またはHEVC規格の拡張に従って、あるいは次世代のビデオコーディング規格に従って動作し得る。ただし、本開示の技法は、いかなる特定のコーディング規格にも限定されない。ビデオコーディング規格の他の例としては、MPEG−2およびITU−T H.263がある。図1には示されていないが、いくつかの態様では、ビデオエンコーダ20およびビデオデコーダ30は、それぞれ、オーディオエンコーダおよびデコーダと統合され得、共通のデータストリームまたは別個のデータストリーム中のオーディオとビデオの両方の符号化を処理するために、適切なMUX−DEMUXユニット、または他のハードウェアおよびソフトウェアを含み得る。適用可能な場合、MUX−DEMUXユニットはITU H.223マルチプレクサプロトコルなどのプロトコル、またはユーザデータグラムプロトコル(UDP)などの他のプロトコルに準拠し得る。
[0059]本開示の技法は、概して、「SERIES H: AUDIOVISUAL AND MULTIMEDIA SYSTEMS,Infrastructure of audiovisual services−Coding of moving video」、高効率ビデオコーディング、ITU−T H.265、2013年4月に記載されている高効率ビデオコーディング(HEVC)とも呼ばれるITU−T H.265に関して説明される。ただし、これらの技法は、HEVCの拡張および他の規格の拡張を含む他のビデオコーディング規格に適用され得る。他のビデオコーディング規格の例としては、ITU−T H.261、ISO/IEC MPEG−1 Visual、ITU−T H.262またはISO/IEC MPEG−2 Visual、ITU−T H.263、ISO/IEC MPEG−4 Visual、および、スケーラブルビデオコーディング(SVC)拡張とマルチビュービデオコーディング(MVC)拡張とを含むITU−T H.264/MPEG−4、Part 10、アドバンストビデオコーディング(AVC)がある。
[0060]H.265規格は、最近、ITU−Tビデオコーディングエキスパートグループ(VCEG:Video Coding Experts Group)とISO/IECモーションピクチャエキスパートグループ(MPEG:Motion Picture Experts Group)とのジョイントコラボレーションチームオンビデオコーディング(JCT−VC:Joint Collaboration Team on Video Coding)によって確定された。以下でHEVC WDと呼ぶ、HEVCドラフト仕様が、http://phenix.int−evry.fr/jct/doc_end_user/documents/14_Vienna/wg11/JCTVC−N1003−v1.zipから入手可能である。
[0061]また、HEVCのマルチビュー拡張であるMV−HEVCがJCT−3Vによって開発された。MV−HEVC WD8と呼ばれる、MV−HEVCのワーキングドラフト(WD)の例が、phenix.it−sudparis.eu/jct2/doc_end_user/documents/8_Valencia/wg11/JCT3V−H1002−v5.zipから入手可能である。SHVCと称するHEVCのスケーラブル拡張も、JCT−VCによって開発された。SHVC WD6と呼ばれるSHVCのワーキングドラフト(WD)の例が、phenix.it−sudparis.eu/jct/doc_end_user/documents/17_Valencia/wg11/JCTVC−Q1008−v2.zipから入手可能である。
[0062]HEVCおよび他のビデオコーデックでは、ビデオフレームまたはピクチャは、ルーマサンプルとクロマサンプルの両方を含み得る最大コーディングユニット(LCU)としても知られる、ツリーブロックのシーケンスに分割され得る。ビットストリーム内のシンタックスデータが、ピクセルの数に関して最大コーディングユニットであるLCUのサイズを定義し得る。スライスは、コーディング順序で、いくつかの連続するツリーブロックを含む。ビデオフレームまたはピクチャは、1つまたは複数のスライスに区分され得る。
[0063]HEVCにおいて符号化CTUを生成するために(すなわち、CTUを符号化するために)、ビデオエンコーダ20は、コーディングツリーブロックをコーディングブロックに分割するために、CTUのコーディングツリーブロックに対して4分木区分化を再帰的に実行することができ、したがって、「コーディングツリーユニット」という名称がある。コーディングブロックはサンプルのN×Nブロックである。CUは、ルーマサンプルアレイ、CbサンプルアレイおよびCrサンプルアレイを有するピクチャの、ルーマサンプルのコーディングブロックと、クロマサンプルの2つの対応するコーディングブロックと、それらのコーディングブロックのサンプルをコーディングするために使用されるシンタックス構造とであり得る。モノクロームピクチャまたは3つの別々の色平面を有するピクチャでは、CUは、単一のコーディングブロックと、そのコーディングブロックのサンプルをコーディングするために使用されるシンタックス構造とを備え得る。
[0064]各ツリーブロックは、4分木データ構造に従ってCUに分割され得る。概して、4分木データ構造はCUごとに1つのノードを含み、ルートノードはツリーブロックに対応する。CUが4つのサブCUに分割された場合、CUに対応するノードは4つのリーフノードを含み、リーフノードの各々はサブCUのうちの1つに対応する。4分木データ構造の各ノードは、対応するCUのシンタックスデータを与え得る。たとえば、4分木内のノードは、そのノードに対応するCUがサブCUに分割されるか否かを示すスプリットフラグを含み得る。CUのシンタックス要素は、再帰的に定義され得、CUがサブCUに分割されるか否かに依存し得る。CUがさらに分割されない場合、そのCUはリーフCUと呼ばれる。本開示では、元のリーフCUの明示的分割が存在しない場合でも、リーフCUの4つのサブCUをリーフCUとも呼ぶ。たとえば、16×16サイズのCUがさらに分割されない場合、その16×16CUが決して分割されなくても、4つの8×8サブCUはリーフCUとも呼ばれる。
[0065]CUは、CUがサイズの特異性を有しないことを別にすれば、H.264規格のマクロブロックと同様の目的を有する。たとえば、ツリーブロックは、(サブCUとも呼ばれる)4つの子ノードに分割され得、各子ノードは、今度は親ノードとなり、別の4つの子ノードに分割され得る。4分木のリーフノードと呼ばれる、最終の、分割されていない子ノードは、リーフCUとも呼ばれるコーディングノードを備える。コード化ビットストリームに関連するシンタックスデータは、最大CU深度と呼ばれる、ツリーブロックが分割され得る最大回数を定義し得、また、コーディングノードの最小サイズを定義し得る。それに応じて、ビットストリームはまた、最小コーディングユニット(SCU)を定義し得る。CUのサイズは、コーディングノードのサイズに対応し、概して形状が正方形である。CUのサイズは、8×8ピクセルから最大サイズ、たとえば、64×64以上のピクセルをもつツリーブロックのサイズまでに及び得る。
[0066]CUは、コーディングノードと、そのコーディングノードに関連する予測ユニット(PU:prediction unit)および変換ユニット(TU:transform unit)とを含む。各CUは、1つまたは複数のPUと1つまたは複数のTUとを含み得る。CUに関連付けられたシンタックスデータは、たとえば、1つまたは複数のPUへのCUの区分を記述し得る。CUを符号化することの一部として、ビデオエンコーダ20は、CUのコーディングブロックを1つまたは複数の予測ブロックに区分し得る。予測ブロックは、同じ予測が適用されるサンプルの矩形(すなわち、正方形または非正方形)ブロックであり得る。CUの予測ユニット(PU)は、ピクチャのルーマサンプルの予測ブロックと、クロマサンプルの2つの対応する予測ブロックと、予測ブロックサンプルを予測するために使用されるシンタックス構造とであり得る。ビデオエンコーダ20は、CUの各PUのルーマ予測ブロックとCb予測ブロックとCr予測ブロックとのための予測ルーマブロックと予測Cbブロックと予測Crブロックとを生成し得る。モノクロームピクチャまたは3つの別々の色平面を有するピクチャでは、PUは、単一の予測ブロックと、その予測ブロックを予測するために使用されるシンタックス構造とを備え得る。
[0067]ビデオエンコーダ20は、PUのための予測ブロックを生成するためにイントラ予測またはインター予測を使用し得る。各CUは、イントラ予測モードまたはインター予測モードのいずれかのうちの1つでコーディングされる。ビデオエンコーダ20がPUの予測ブロックを生成するためにイントラ予測を使用する場合、ビデオエンコーダ20は、PUに関連するピクチャの復号されたサンプルに基づいてPUの予測ブロックを生成し得る。ビデオエンコーダ20が、PUの予測ブロックを生成するためにインター予測を使用する場合、ビデオエンコーダ20は、PUに関連するピクチャ以外の1つまたは複数のピクチャの復号サンプルに基づいて、PUの予測ブロックを生成し得る。
[0068]区分モードは、CUがスキップであるのか、または直接モード符号化されるのか、イントラ予測モード符号化されるのか、またはインター予測モード符号化されるのかの間で異なり得る。PUは、形状が非正方形になるように区分され得る。
[0069]さらに、ビデオエンコーダ20は、1つまたは複数の変換ブロックにCUの各残差ブロックを分解し得る。変換ブロックは、同じ変換が適用されるサンプルの矩形(正方形または非正方形)ブロックであり得る。CUの変換ユニット(TU)は、ルーマサンプルの変換ブロックと、クロマサンプルの2つの対応する変換ブロックと、変換ブロックサンプルを変換するために使用されるシンタックス構造とであり得る。したがって、CUの各TUは、ルーマ変換ブロック、Cb変換ブロック、およびCr変換ブロックに関連付けられ得る。TUに関連付けられたルーマ変換ブロックは、CUのルーマ残差ブロックのサブブロックであり得る。Cb変換ブロックは、CUのCb残差ブロックのサブブロックであり得る。Cr変換ブロックは、CUのCr残差ブロックのサブブロックであり得る。モノクロームピクチャまたは3つの別々の色平面を有するピクチャでは、TUは、単一の変換ブロックと、その変換ブロックのサンプルを変換するために使用されるシンタックス構造とを備え得る。いくつかの例では、残差ブロック、ルーマ成分およびクロマ成分に対して同じCUは、様々な方法で区分され得る。
[0070]CUに関連するシンタックスデータはまた、たとえば、4分木に従うCUの1つまたは複数のTUへの区分を記述し得る。TUは、形状が正方形または非正方形(たとえば、矩形)であり得る。本開示は、「ブロック」という用語を、HEVCのコンテキストにおいてCU、PU、またはTUのうちのいずれか、または他の規格のコンテキストにおいて同様のデータ構造(たとえば、H.264/AVCのマクロブロックおよびそのサブブロック)を参照するために使用し得る。
[0071]HEVC規格は、CUごとに異なり得る、TUに従う変換を可能にする。TUは、一般に、区分されたLCUのために定義された所与のCU内のPUのサイズに基づいてサイズ決定されるが、これは常にそうであるとは限らない。TUは、一般に、PUと同じサイズであるかまたはPUよりも小さい。いくつかの例では、CUに対応する残差サンプルは、「残差4分木」(RQT:residual quad tree)として知られる4分木構造を使用してより小さいユニットに再分割され得る。RQTのリーフノードは、変換ユニット(TU)と呼ばれることがある。TUに関連するピクセル差分値は、変換係数を生成するために変換され得、その変換係数は量子化され得る。
[0072]リーフCUは1つまたは複数のPUを含み得る。概して、PUは、対応するCUの全部または一部分に対応する空間エリアを表し、そのPUの参照サンプルを取り出しおよび/または生成するためのデータを含み得る。その上、PUは、予測に関係するデータを含む。たとえば、PUがイントラモード符号化されるとき、PUのためのデータは、PUに対応するTUのためのイントラ予測モードを記述するデータを含み得るRQT中に含まれ得る。RQTは変換ツリーと呼ばれることもある。いくつかの例では、イントラ予測モードは、RQTの代わりに、リーフCUシンタックス中でシグナリングされ得る。一例として、PUがインターモード符号化されるとき、PUは、PUのための、1つまたは複数の動きベクトルなど、動き情報を定義するデータを含み得る。PUのための動きベクトルを定義するデータは、たとえば、動きベクトルの水平成分、動きベクトルの垂直成分、動きベクトルについての解像度(たとえば、1/4ピクセル精度または1/8ピクセル精度)、動きベクトルが指す参照ピクチャ、および/または動きベクトルのための参照ピクチャリスト(たとえば、リスト0、リスト1、またはリストC)を記述し得る。
[0073]1つまたは複数のPUを有するリーフCUはまた、1つまたは複数のTUを含み得る。変換ユニットは、上で論じたように、RQT(TU4分木構造とも称する)を使用して指定され得る。たとえば、分割フラグは、リーフCUが4つの変換ユニットに分割されるのかどうかを示し得る。次いで、各変換ユニットは、さらなるサブTUにさらに分割され得る。TUがさらに分割されないとき、それはリーフTUと呼ばれることがある。概して、イントラコーディングの場合、リーフCUに属するすべてのリーフTUは同じイントラ予測モードを共有する。すなわち、概して、リーフCUのすべてのTUの予測値を計算するために同じイントラ予測モードが適用される。イントラコーディングでは、ビデオエンコーダは、イントラ予測モードを使用して各リーフTUの残差値を、TUに対応するCUの一部と元のブロックとの間の差分として計算し得る。TUは、必ずしもPUのサイズに制限されるとは限らない。したがって、TUは、PUよりも大きいことも小さいこともある。イントラコーディングでは、PUは、同じCUのための対応するリーフTUとコロケートされ得る。いくつかの例では、リーフTUの最大サイズは、対応するリーフCUのサイズに対応し得る。
[0074]その上、リーフCUのTUはまた、上述のようにRQTまたは変換ツリーと呼ばれる、それぞれの4分木データ構造に関連付けられ得る。すなわち、リーフCUは、そのリーフCUがTUにどのように区分されるかを示す4分木を含み得る。TU4分木のルートノードは概してリーフCUに対応し、CU4分木のルートノードは概してツリーブロックに対応する。分割されないRQTのTUはリーフTUと呼ばれる。概して、本開示では、別段に明記されていない限り、リーフCUおよびリーフTUに言及するためにそれぞれCUおよびTUという用語を使用する。
[0075]ビデオシーケンスは、通常、一連のビデオフレームまたはピクチャを含む。ピクチャの各スライスは、それぞれのスライスの符号化モードを記述するスライスシンタックスデータを含み得る。ビデオエンコーダ20は、通常、ビデオデータを符号化するために、個々のビデオスライス内のビデオブロックに対して動作する。ビデオブロックは、CU内のコーディングノードに対応し得る。ビデオブロックは、固定サイズまたは可変サイズを有し、指定のコーディング規格に応じてサイズが異なり得る。
[0076]本開示では、「N×N」および「N by N」は、垂直方向の寸法および水平方向の寸法に関するビデオブロックのピクセル寸法、たとえば、16x16ピクセルまたは16×16(16 by 16)ピクセルを指すために互換的に使用され得る。概して、16×16ブロックは、垂直方向に16ピクセル(y=16)、および水平方向に16ピクセル(x=16)を有する。同様に、N×Nブロックは、概して、垂直方向にNピクセルを有し、水平方向にNピクセルを有し、ここで、Nは非負整数値を表す。ブロック中のピクセルは行および列に配列され得る。その上、ブロックは、必ずしも、水平方向において垂直方向と同じ数のピクセルを有する必要があるとは限らない。たとえば、ブロックはN×Mピクセルを備え得、ここで、Mは必ずしもNに等しいとは限らない。
[0077]CUのPUを使用したイントラ予測コーディングまたはインター予測コーディングに続いて、ビデオエンコーダ20は、CUのTUのための残差データを計算し得る。PUは、(ピクセル領域とも呼ばれる)空間領域において予測ピクセルデータを生成する技法またはモードを記述するシンタックスデータを備え得、TUは、変換、たとえば、残差ビデオデータへの離散コサイン変換(DCT)、整数変換、ウェーブレット変換、または概念的に同様の変換の適用後に、変換領域において係数を備え得る。残差データは、符号化されていないピクチャのピクセルとPUに対応する予測値との間のピクセル差に対応し得る。ビデオエンコーダ20は、CUのための残差データを表す量子化された変換係数を含むようにTUを形成し得る。すなわち、ビデオエンコーダ20は、(残差ブロックの形態の)残差データを計算し、変換係数のブロックを生成するために残差ブロックを変換し、次いで、被量子化変換係数を形成するために変換係数を量子化し得る。ビデオエンコーダ20は、量子化された変換係数を含むTU、ならびに他のシンタックス情報(たとえば、TUのための分割情報)を形成し得る。
[0078]上述のように、変換係数を生成するための任意の変換の適用の後に、ビデオエンコーダ20は、変換係数の量子化を実行し得る。量子化は、一般に、係数を表すために使用されるデータの量をできるだけ低減するために変換係数が量子化され、さらなる圧縮を行うプロセスを指す。量子化プロセスは、係数の一部または全部に関連付けられたビット深度を低減し得る。たとえば、量子化中にnビット値がmビット値に切り捨てられ得、ただし、nはmよりも大きい。
[0079]量子化の後に、ビデオエンコーダ20は、変換係数を走査して、量子化変換係数を含む2次元行列から1次元ベクトルを生成し得る。走査は、アレイの前部により高いエネルギー(したがって、より低い周波数)係数を配置し、アレイの後部により低いエネルギー(したがって、より高い周波数)係数を配置するように設計され得る。いくつかの例では、ビデオエンコーダ20は、エントロピー符号化され得るシリアル化ベクトルを生成するために、量子化された変換係数を走査するためにあらかじめ定義された走査順序を利用し得る。他の例では、ビデオエンコーダ20は適応型走査を実行し得る。量子化された変換係数を走査して1次元ベクトルを形成した後に、ビデオエンコーダ20は、たとえば、コンテキスト適応型可変長コーディング(CAVLC)、コンテキスト適応型バイナリ算術コーディング(CABAC)、シンタックスベースコンテキスト適応型バイナリ算術コーディング(SBAC)、確率間隔区分エントロピー(PIPE)コーディングまたは別のエントロピー符号化方法に従って、1次元ベクトル中の変換係数を表す特定のシンタックス要素をエントロピー符号化し得る。ビデオエンコーダ20はまた、ビデオデータを復号する際にビデオデコーダ30によって使用するための、符号化ビデオデータに関連付けられたシンタックス要素をエントロピー符号化し得る。
[0080]概して、ビデオデコーダ30は、符号化データを復号するためにビデオエンコーダ20によって実行されるものと、相反するが、同様のプロセスを実行する。たとえば、ビデオデコーダ30は、残差ブロックを再生するために、受信されたTUの変換係数を逆量子化および逆変換する。ビデオデコーダ30は、予測されたブロックを形成するために、シグナリングされた予測モード(イントラ予測またはインター予測)を使用し得る。ビデオデコーダ30は、元のブロックを再生するために予測されたブロックと残差ブロックとを(ピクセルごとに)組み合わせ得る。ビデオデコーダ30は、ブロック境界に沿って視覚的アーティファクトを低減するためにデブロッキングプロセスを実行することなどの追加の処理を実行し得る。さらに、ビデオデコーダ30は、ビデオエンコーダ20のCABAC符号化プロセスに相反するが、それと実質的に同様の様式でCABACを使用してシンタックス要素を復号し得る。
[0081]前述のように、ビデオエンコーダ20は、DCT、整数変換、ウェーブレット変換、または概念的に同様の変換を残差ビデオデータに適用し得る。そのような分離可能変換は、入力信号の代替表現を導出するプロセスを示し得る。N点ベクトルx=[x0,x1,...,×N-1Tおよび所与のベクトル{Φ0,Φ1,...,ΦM-1}のセットを仮定すれば、xは、近似されるか、またはΦ0,Φ1,...,ΦM-1の線形結合を使用して正確に表され得、これは、次のように公式化され得る。
上式で、
は、xの近似値または均等物であり得、ベクトルf=[fi,f2,...,fM-1]は、変換係数ベクトルと呼ばれ、{Φ0,Φ1,...,ΦM-1}は、変換基底ベクトルである。
[0082]ビデオコーディングのシナリオでは、変換係数は、ほぼ非相関であり、疎であり得る。たとえば、入力ベクトルxのエネルギーは、数個の変換係数だけに圧縮され得、残りの大多数の変換係数は一般に0に近くなる。
[0083]特定の入力データを仮定すれば、エネルギー圧縮に関する最適な変換は、いわゆるカルーネンレーベ変換(KLT)であり得る。KLTは、変換基底ベクトルとして入力データの共分散行列の固有ベクトルを使用する。したがって、KLTは、実際には、データ依存型の変換であり、一般的な数学的公式化を有しない。しかしながら、入力データが1次定常マルコフ過程を形成するなどのいくつかの仮定の下で、対応するKLTが実際には単一変換の正弦波ファミリーのメンバーであることが文献で証明されており、これは、Jain,A.K.、A sinusoidal family of unitary transforms、IEEE Trans.on Pattern Analysis and Machine Intelligence、1、356、1979に記載されている。単一変換の正弦波ファミリーは、次のように公式化される変換基底ベクトルを使用して変換を示し得る。
上記の式中で、eは、2.71828にほぼ等しい自然対数の底であり、A、B、およびθは概して複素数であり、mの値に依存する。さらに、上記の式中で、Φmは、ベクトルであり、Φm(k)は、ベクトルΦmのk番目の成分を示し、iは、複素数の虚数部を示す。
[0084]離散フーリエ変換、コサイン変換、サイン変換、および(1次定常マルコフ過程のための)KLTを含むいくつかのよく知られている変換は、単体変換のこの正弦波ファミリーのメンバーである。S.A.Martucci、「Symmetric convolution and the discrete sine and cosine transforms」、IEEE Trans.Sig.Processing SP−42、1038−1051(1994)に記載されているように、完全なDCTおよび離散サイン変換(DST)ファミリーは、異なるタイプに基づいて合計16個の変換を含み得、DCTおよびDSTの異なるタイプの完全な定義を以下に与える。異なるタイプは、A、B、およびθの異なる値に対応し得る。
[0085]入力N点ベクトルが、x=[x0,x1,...,×N-1Tとして示されると仮定すると、N点ベクトルは、行列を乗じることによってy=[y0,y1,...,yN-1Tとして示される別のN点変換係数ベクトルに変換される。xからyに変換するプロセスは、さらに、以下の変換公式化のうちの1つに従って示され得、ここにおいて、kは、両端値を含む0〜N−1にわたる。
DCTタイプI(DCT−1):

上式で、
DCTタイプII(DCT−2):

上式で、
DCTタイプIII(DCT−3):

上式で、
DCTタイプIV(DCT−4):

DCTタイプV(DCT−5):

上式で、
DCTタイプVI(DCT−6):

上式で、
DCTタイプVII(DCT−7):

上式で、
DCTタイプVIII(DCT−8):

DSTタイプI(DST−1):

DSTタイプII(DST−2):

上式で、
DSTタイプIII(DST−3):

上式で、
DSTタイプIV(DST−4):

DSTタイプV(DST−5):

DSTタイプVI(DST−6):

DCTタイプVII(DST−7):

DSTタイプVIII(DST−8):

上式で、
[0086]DSTタイプなどの変換タイプは、変換基底関数の数学的公式化によって指定され得る。たとえば、4点DST−VIIおよび8点DST−VIIは、Nの値にかかわらず同じ変換タイプを有する。
[0087]一般性を失うことなく、すべての上記の変換タイプは、以下の一般的公式化を使用して表され得る。
上記の式中で、Tは、ある変換の定義によって指定され得る変換行列、たとえば、DCTタイプI〜DCTタイプVIIIまたはDSTタイプI〜DSTタイプVIIIであり、Tの行ベクトル、たとえば、[Ti,0,Ti,1,Ti,2,...,Ti,N-1]は、i番目の変換基底ベクトルである。N点入力ベクトルに適用される変換は、N点変換と呼ばれることがある。
[0088]また、1次元入力データxに適用される上記の変換公式化が、以下のような行列乗算形態で表され得ることに留意されたい。
y=T・x
上記の式中で、Tは、変換行列を示し、xは、入力データベクトルを示し、yは、出力変換係数ベクトルを示す。
[0089]前の部分に導入された変換は、1次元入力データに適用され得、変換はまた、2次元入力データソースに拡張され得る。以下の説明では、Xは、入力M×Nデータアレイである。2次元入力データに変換を適用する技法は、分離可能および非分離可能2次元変換を含み得る。
[0090]分離可能2次元変換は、以下のように公式化される、Xの水平および垂直ベクトルに連続的に1次元変換を適用する。
Y=C・X・RT
上記の式中で、CおよびRは、それぞれ、所与のM×MおよびN×Nの変換行列を示す。公式化から、Cが、Xの列ベクトルに1次元変換を適用し、一方、Rが、Xの行ベクトルに1次元変換を適用することがわかる。本明細書の後の部分において、簡単のために、CおよびRは、左側(垂直)および右側(水平)変換として示され、それらはどちらも、変換ペアを形成する。Cが、Rに等しく、直交行列である場合がある。そのような場合、分離可能2次元変換は、ただ1つの変換行列によって決定され得る。
[0091]いくつかの例では、非分離可能2次元変換は、最初に、以下の数学的マッピングを適用することによって、Xのすべての要素を単一のベクトル、すなわち、X’に再編成し得る。
X’(i・N+j)=Xi,j
次いで、1次元変換T’は、下記のようにX’に適用され得る。
Y=T’・X’
上記の式中で、T’は、(M*N)×(M*N)変換行列である。
[0092]ビデオコーディングでは、2次元変換が、1次元変換と比較してより少ない動作カウント(たとえば、加算、乗算)を使用し得るので、分離可能2次元変換が適用され得る。
[0093]H.264/AVCなどの従来のビデオコーデックでは、4点および8点DCTタイプIIの整数近似値がイントラおよびインター予測残差の両方に適用される。言い換えれば、ビデオコーダは、イントラまたはインター予測を使用して生成される残差ブロックに4点および8点DCTタイプIIの整数近似値を適用し得る。残差サンプルの様々な統計値により良く適応するために、DCTタイプII以外の変換のよりフレキシブルなタイプが、新世代のビデオコーデックにおいて利用される。たとえば、HEVCでは、イントラ予測残差のために、4点タイプVII DSTの整数近似値が利用され得る。J.Han、A.SaxenaおよびK.Rose、「Towards jointly optimal spatial prediction and adaptive transform in video/image coding」、IEEE International Conference on Acoustics,Speech and Signal Processing(ICASSP)、2010年3月、pp.726〜729に記載されているように、HEVCで使用されるDSTタイプVIIが、イントラ予測方向に沿って生成される残差ベクトルについてDCTタイプIIよりも効率的であることが理論的に証明され、実験的に実証されている。たとえば、DSTタイプVIIは、水平イントラ予測方向によって生成された行残差ベクトルについてDCTタイプIIよりも効率的である。HEVCでは、4点DSTタイプVIIの整数近似値は、4×4ルーマイントラ予測残差ブロックにのみ適用される。HEVCで使用される4点DST−VIIを以下に示す。
4×4DST−VII:
{29,55,74,84}
{74,74,0,−74}
{84,−29,−74,55}
{55,−84,74,−29}
[0094]HEVCでは、4×4ルーマイントラ予測残差ブロックでない残差ブロックに対して、以下に示すように、4点、8点、16点および32点DCTタイプIIの整数近似値も適用され得る。
4点DCT−II:
{64,64,64,64}
{83,36,−36,−83}
{64,−64,−64,64}
{36,−83,83,−36}
8点DCT−II:
{64,64,64,64,64,64,64,64}
{89,75,50,18,−18,−50,−75,−89}
{83,36,−36,−83,−83,−36,36,83}
{75,−18,−89,−50,50,89,18,−75}
{64,−64,−64,64,64,−64,−64,64}
{50,−89,18,75,−75,−18,89,−50}
{36,−83,83,−36,−36,83,−83,36}
{18,−50,75,−89,89,−75,50,−18}
16点DCT−II:
{64,64,64,64,64,64,64,64,64,64,64,64,64,64,64,64}
{90,87,80,70,57,43,25,9,−9,−25,−43,−57,−70,−80,−87,−90}
{89,75,50,18,−18,−50,−75,−89,−89,−75,−50,−18,18,50,75,89}
{87,57,9,−43,−80,−90,−70,−25,25,70,90,80,43,−9,−57,−87}
{83,36,−36,−83,−83,−36,36,83,83,36,−36,−83,−83,−36,36,83}
{80,9,−70,−87,−25,57,90,43,−43,−90,−57,25,87,70,−9,−80}
{75,−18,−89,−50,50,89,18,−75,−75,18,89,50,−50,−89,−18,75}
{70,−43,−87,9,90,25,−80,−57,57,80,−25,−90,−9,87,43,−70}
{64,−64,−64,64,64,−64,−64,64,64,−64,−64,64,64,−64,−64,64}
{57,−80,−25,90,−9,−87,43,70,−70,−43,87,9,−90,25,80,−57}
{50,−89,18,75,−75,−18,89,−50,−50,89,−18,−75,75,18,−89,50}
{43,−90,57,25,−87,70,9,−80,80,−9,−70,87,−25,−57,90,−43}
{36,−83,83,−36,−36,83,−83,36,36,−83,83,−36,−36,83,−83,36}
{25,−70,90,−80,43,9,−57,87,−87,57,−9,−43,80,−90,70,−25}
{18,−50,75,−89,89,−75,50,−18,−18,50,−75,89,−89,75,−50,18}
{9,−25,43,−57,70,−80,87,−90,90,−87,80,−70,57,−43,25,−9}
32点DCT−II:
{64,64,64,64,64,64,64,64,64,64,64,64,64,64,64,64,64,64,64,64,64,64,64,64,64,64,64,64,64,64,64,64}
{90,90,88,85,82,78,73,67,61,54,46,38,31,22,13,4,−4,−13,−22,−31,−38,−46,−54,−61,−67,−73,−78,−82,−85,−88,−90,−90}
{90,87,80,70,57,43,25,9,−9,−25,−43,−57,−70,−80,−87,−90,−90,−87,−80,−70,−57,−43,−25,−9,9,25,43,57,70,80,87,90}
{90,82,67,46,22,−4,−31,−54,−73,−85,−90,−88,−78,−61,−38,−13,13,38,61,78,88,90,85,73,54,31,4,−22,−46,−67,−82,−90}
{89,75,50,18,−18,−50,−75,−89,−89,−75,−50,−18,18,50,75,89,89,75,50,18,−18,−50,−75,−89,−89,−75,−50,−18,18,50,75,89}
{88,67,31,−13,−54,−82,−90,−78,−46,−4,38,73,90,85,61,22,−22,−61,−85,−90,−73,−38,4,46,78,90,82,54,13,−31,−67,−88}
{87,57,9,−43,−80,−90,−70,−25,25,70,90,80,43,−9,−57,−87,−87,−57,−9,43,80,90,70,25,−25,−70,−90,−80,−43,9,57,87}
{85,46,−13,−67,−90,−73,−22,38,82,88,54,−4,−61,−90,−78,−31,31,78,90,61,4,−54,−88,−82,−38,22,73,90,67,13,−46,−85}
{83,36,−36,−83,−83,−36,36,83,83,36,−36,−83,−83,−36,36,83,83,36,−36,−83,−83,−36,36,83,83,36,−36,−83,−83,−36,36,83}
{82,22,−54,−90,−61,13,78,85,31,−46,−90,−67,4,73,88,38,−38,−88,−73,−4,67,90,46,−31,−85,−78,−13,61,90,54,−22,−82}
{80,9,−70,−87,−25,57,90,43,−43,−90,−57,25,87,70,−9,−80,−80,−9,70,87,25,−57,−90,−43,43,90,57,−25,−87,−70,9,80}
{78,−4,−82,−73,13,85,67,−22,−88,−61,31,90,54,−38,−90,−46,46,90,38,−54,−90,−31,61,88,22,−67,−85,−13,73,82,4,−78}
{75,−18,−89,−50,50,89,18,−75,−75,18,89,50,−50,−89,−18,75,75,−18,−89,−50,50,89,18,−75,−75,18,89,50,−50,−89,−18,75}
{73,−31,−90,−22,78,67,−38,−90,−13,82,61,−46,−88,−4,85,54,−54,−85,4,88,46,−61,−82,13,90,38,−67,−78,22,90,31,−73}
{70,−43,−87,9,90,25,−80,−57,57,80,−25,−90,−9,87,43,−70,−70,43,87,−9,−90,−25,80,57,−57,−80,25,90,9,−87,−43,70}
{67,−54,−78,38,85,−22,−90,4,90,13,−88,−31,82,46,−73,−61,61,73,−46,−82,31,88,−13,−90,−4,90,22,−85,−38,78,54,−67}
{64,−64,−64,64,64,−64,−64,64,64,−64,−64,64,64,−64,−64,64,64,−64,−64,64,64,−64,−64,64,64,−64,−64,64,64,−64,−64,64}
{61,−73,−46,82,31,−88,−13,90,−4,−90,22,85,−38,−78,54,67,−67,−54,78,38,−85,−22,90,4,−90,13,88,−31,−82,46,73,−61}
{57,−80,−25,90,−9,−87,43,70,−70,−43,87,9,−90,25,80,−57,−57,80,25,−90,9,87,−43,−70,70,43,−87,−9,90,−25,−80,57}
{54,−85,−4,88,−46,−61,82,13,−90,38,67,−78,−22,90,−31,−73,73,31,−90,22,78,−67,−38,90,−13,−82,61,46,−88,4,85,−54}
{50,−89,18,75,−75,−18,89,−50,−50,89,−18,−75,75,18,−89,50,50,−89,18,75,−75,−18,89,−50,−50,89,−18,−75,75,18,−89,50}
{46,−90,38,54,−90,31,61,−88,22,67,−85,13,73,−82,4,78,−78,−4,82,−73,−13,85,−67,−22,88,−61,−31,90,−54,−38,90,−46}
{43,−90,57,25,−87,70,9,−80,80,−9,−70,87,−25,−57,90,−43,−43,90,−57,−25,87,−70,−9,80,−80,9,70,−87,25,57,−90,43}
{38,−88,73,−4,−67,90,−46,−31,85,−78,13,61,−90,54,22,−82,82,−22,−54,90,−61,−13,78,−85,31,46,−90,67,4,−73,88,−38}
{36,−83,83,−36,−36,83,−83,36,36,−83,83,−36,−36,83,−83,36,36,−83,83,−36,−36,83,−83,36,36,−83,83,−36,−36,83,−83,36}
{31,−78,90,−61,4,54,−88,82,−38,−22,73,−90,67,−13,−46,85,−85,46,13,−67,90,−73,22,38,−82,88,−54,−4,61,−90,78,−31}
{25,−70,90,−80,43,9,−57,87,−87,57,−9,−43,80,−90,70,−25,−25,70,−90,80,−43,−9,57,−87,87,−57,9,43,−80,90,−70,25}
{22,−61,85,−90,73,−38,−4,46,−78,90,−82,54,−13,−31,67,−88,88,−67,31,13,−54,82,−90,78,−46,4,38,−73,90,−85,61,−22}
{18,−50,75,−89,89,−75,50,−18,−18,50,−75,89,−89,75,−50,18,18,−50,75,−89,89,−75,50,−18,−18,50,−75,89,−89,75,−50,18}
{13,−38,61,−78,88,−90,85,−73,54,−31,4,22,−46,67,−82,90,−90,82,−67,46,−22,−4,31,−54,73,−85,90,−88,78,−61,38,−13}
{9,−25,43,−57,70,−80,87,−90,90,−87,80,−70,57,−43,25,−9,−9,25,−43,57,−70,80,−87,90,−90,87,−80,70,−57,43,−25,9}
{4,−13,22,−31,38,−46,54,−61,67,−73,78,−82,85,−88,90,−90,90,−90,88,−85,82,−78,73,−67,61,−54,46,−38,31,−22,13,−4}
[0095]http://www.hhi.fraunhofer.de/fields−of−competence/image−processing/research−groups/image−video−coding/hevc−high−efficiency−video−coding/transform−coding−using−the−residual−quadtree−rqt.htmlに記載されているように、残差ブロックの様々な特性に適合するために、HEVCでは残差4分木(RQT)を使用する変換コーディング構造が適用され得る。上記で簡単に説明したように、各ピクチャは、コーディングツリーユニット(CTU)に分割され得る。CTUは、特定のタイルまたはスライスについてラスタ走査順序でコーディングされ得る。CTUは、正方形ブロックであり得、4分木、たとえば、コーディングツリーのルートを表し得る。CTUサイズは8×8から64×64ルーマサンプルにわたり得るが、一般に64×64が使用される。各CTUは、さらに、CUと呼ばれるより小さい正方形ブロックに分割され得る。CTUがCUに再帰的に分割された後、各CUは、さらに、1つまたは複数のPUおよび1つまたは複数のTUに分割され得る。CUのTUへの区分は、4分木手法に基づいて再帰的に実行され得る。したがって、各CUの残差信号は、ツリー構造、すなわち、残差4分木(RQT)によってコーディングされる。
[0096]RQTは、4×4から32×32ルーマサンプルまでのTUサイズを可能にする。図2に、CUが、文字a〜jで標示された10個のTUを含む一例と、対応するブロック区分とを示す。RQTの各ノードは、実際はTUであり得る。個々のTUは、深度優先トラバーサルによる再帰的Z走査に従う、アルファベット順として図2に示す深度優先ツリートラバーサル順序で処理され得る。4分木手法は、残差信号の変動する空間周波数特性に対する変換の適応を可能にし得る。一般に、より大きい空間サポートを有するより大きい変換ブロックサイズは、より良い周波数解像度を与える。しかしながら、より小さい空間サポートを有するより小さい変換ブロックサイズは、より良い空間解像度を与える。空間解像度と周波数解像度との2つの間のトレードオフは、エンコーダモード決定によって選定され得る。たとえば、より大きいまたはより小さい変換ブロックサイズの選定は、レートひずみ最適化技法に基づき得る。レートひずみ最適化技法は、各コーディングモード(たとえば、特定のRQT分割構造)についてコーディングビットと再構築ひずみとの加重和、たとえば、レートひずみコストを計算し得る。さらに、レートひずみ最適化技法は、最小レートひずみコストをもつコーディングモードを最良のモードとして選択し得る。
[0097]3つのパラメータ、すなわち、RQTの最大深度、RQTの最小許容変換サイズ、および最大許容変換サイズがRQTにおいて定義され得る。最小および最大変換サイズは、前の段落で述べたサポートされるブロック変換に対応し得る、4×4から32×32サンプルまでの範囲内で変動し得る。RQTの最大許容深度はTUの数を制限し得る。0に等しい最大深度は、各含まれた変換ブロック(TB)が最大許容変換サイズ、たとえば、32×32に達した場合、コーディングブロック(CB)がこれ以上分割され得ないことを意味し得る。
[0098]3つのパラメータの各々は、相互作用し、RQT構造に影響を及ぼす。ルートCBサイズが64×64であり、最大深度が0に等しく、最大変換サイズが32×32に等しい場合について考える。この場合、CBは、さもなければ、それが、許容されないことがある64×64TBにつながることになるので、少なくとも1回区分され得る。RQTパラメータ、たとえば、最大RQT深度、最小および最大変換サイズは、シーケンスパラメータセットレベルにおいてビットストリーム中で送信され得る。RQT深度に関して、イントラコード化CUとインターコード化CUとについて異なる値が指定され、シグナリングされ得る。
[0099]4分木変換は、イントラ残差ブロックとインター残差ブロックの両方に適用され得る。現在の残差4分木パーティションと同じサイズのDCT−II変換が残差ブロックに適用され得る。しかしながら、現在の残差4分木ブロックが4×4であり、イントラ予測によって生成される場合、上記の4×4DST−VII変換が適用され得る。HEVCでは、より大きいサイズの変換、たとえば、64×64変換は、主に、それらの限られた利益と比較的より小さい解像度のビデオに対する比較的高い複雑さとにより採用されない。
[0100]DSTタイプVIIが従来のDCTタイプIIと比較してイントラコーディング効率を効率的に改善し得ることにもかかわらず、予測残差が様々な統計値を提示するので、変換効率は、比較的制限され得、DCTタイプIIおよびDSTタイプVIIの固定使用は、すべての可能な場合に効率的に適合しないことがある。
[0101]Limら、「Rate−distortion optimized adaptive transform coding」、Opt.Eng.vol.48、no.8、pp.087004−1〜087004−14、2009年8月に記載されているように、変換方式は、予測残余についてDCTまたはDSTの整数バージョンを適応的に採用し、ブロックごとに、DCTまたはDST変換が予測残余のために使用されるのかどうかがシグナリングされる。Proc.15th IEEE Int.Conf.Image Process.におけるY.YeおよびM.Karczewicz、「Improved H.264 intra coding based on bidirectional intra prediction,directional transform,and adaptive coefficient scanning」、2008年10月、pp.2116〜2119に記載されているように、各イントラ予測モードは、変換の一意のペア(たとえば、CおよびR)、KLTペアとしてあらかじめ定義されたペアにマッピングされ得、したがって、モード依存変換(MDDT)が適用される。このようにして、異なるイントラ予測モードのために異なるKLTが使用され得る。ただし、どの変換を使用すべきかは、あらかじめ定義され、イントラ予測モードに依存する。
[0102]しかしながら、X.Zhaoら、「Video coding with rate−distortion optimized transform」、IEEE Trans.Circuits Syst.Video Technol.、vol.22、no.1、pp.138〜151、2012年1月に記載されているように、より多くの変換が使用され得、そのような例は、オフライントレーニングプロセスから導出される変換候補のあらかじめ定義されたセットからの変換へのインデックスを明示的にシグナリングし得る(たとえば、インデックスを示すデータを符号化し得る)。MDDTと同様に、そのような例では、各イントラ予測方向は、変換のペアのそれの一意のセットを有し得る。インデックスは、どの変換ペアがセットから選定されるのかを指定するためにシグナリングされ得る。たとえば、最も小さいブロックサイズ4×4では最大4つの垂直KLTと最大4つの水平KLTとがあり得る。したがって、この例では、16個の組合せが選定され得る。より大きいブロックサイズでは、より少数の組合せが使用され得る。本開示で提案する技法は、イントラ予測残差とインター予測残差との両方に適用し得る。本開示では、イントラ予測残差は、イントラ予測を使用して生成される残差データを指す。さらに、本開示では、インター予測残差は、インター予測を使用して生成される残差データを指す。インター予測残差では、KLTの最大16個の組合せが選定され得、組合せ(4×4では4つ、および8×8では16個)のうちの1つへのインデックスがブロックごとにシグナリングされ得る。
[0103]Saxenaら、「DCT/DST−based transform coding for intra prediction in image/video coding」、IEEE Trans.Image Processing、およびYeoら、「Mode−dependent transforms for coding directional intra prediction residuals」、IEEE Trans.Circuits Syst.Video Technol.vol.22、no.4、pp.545〜554、2012に記載されているように、複数の変換が使用され得る。ただし、そのような例では、(トレーニングされ得る)KLTを使用する代わりに、(左変換と右変換との両方が同じである)変換ユニットのために、DCT(DCT−II)またはDST(DST−VII)のいずれかが使用され得、どちらを使用すべきかは、シグナリングされたフラグによって決定される。
[0104]さらに、Zouら、「Rate−Distortion Optimized Transforms Based on the Lloyd−Type Algorithm for Intra Block Coding」、IEEE Journal of Selected Topics in Signal Processing、Volume:7、Issue:6、2013年11月に記載されているように、いくつかのあらかじめ定義されたKLTペアが使用され、変換ペアへのインデックスが、コーディングユニットについて(導出される代わりに)シグナリングされ得、したがって、CUの各TUが変換の同じペアを使用する。
[0105]Anら、「Non−CE7:Boundary−Dependent Transform for Inter−Predicted Residue」、JCTVC−G281に記載されているように、CU内のそれらのロケーションに従ってTUのインター予測された残差のために複数の変換が選定され得る。DST−VIIとDST−VIIの反転バージョンとから、C変換とR変換との両方が選定され得る。したがって、CU内のTUにとって最大4つの組合せが可能であり得る。しかしながら、組合せがPUのロケーションによって完全に決定され得るので、どの組合せが使用されているのかをシグナリングする必要がないことがある。
[0106]2015年3月23日に出願された米国仮出願第62/137,038号、2015年1月26日に出願された米国仮出願第62/107,996号、および2016年1月25日に出願された米国特許出願第15/005,736号において、イントラ予測残差とインター予測残差との両方のための拡張複数変換(EMT:Enhanced Multiple Transforms)技法が提案されている。EMTでは、従来のDCT−2タイプの変換のみが使用されるのか、または他の非DCT2タイプの変換が使用されるのかを示すためにCUレベルのフラグがシグナリングされ得る。CUレベルが1としてシグナリングされる場合、現在のTUのために変換サブセットからどの水平/垂直変換が使用されるのかを示すために現在のCU内のTUごとに2ビットのTUレベルのインデックスがさらにシグナリングされ得る。変換サブセットは、DST−VII、DCT−VIII、DCT−VおよびDST−Iから選択される2つの変換を含み得、選択は、イントラ予測モードとそれが水平変換サブセットであるのか垂直変換サブセットであるのかとに基づき得る。
[0107]図3Aは、ビデオエンコーダ20などのビデオエンコーダにおける例示的な変換プロセスの図である。図3Bは、ビデオデコーダ30などのビデオデコーダにおける例示的な変換プロセスの図である。図3Aの例では、ビデオエンコーダ20は、順方向1次変換40(fwdT)と、それに続く2次変換41(fwdR)と、それに続く順方向量子化42(fwdQua)とを適用する。図3Bの例では、ビデオデコーダ30は、逆量子化43(invQ)と、それに続く逆2次変換44(invR)と、それに続く逆1次変換45(invTran)とを適用する。順方向1次変換40は、ピクセル領域からの残差サンプルを周波数領域中の変換係数に変換し得る。逆1次変換43は、周波数領域中の変換係数をピクセル領域中の残差サンプルに変換し得る。
[0108]2次変換41は、変換係数のより良いエネルギー圧縮のために使用され得る。図3Aおよび図3Bに示すように、2次変換41は、第1の変換プロセスから導出された変換係数に対して別の変換を適用し得る。
[0109]E.Alshina、A.Alshin、F.Fernandes、A.Saxena、V.Seregin、Z.Ma、W.−J.Han(Samsung)、「CE7:Experimental results of ROT by Samsung」ITU−T SG16 WP3とISO/IEC JTC1/SC29/WG11とのビデオコーディング共同研究部会(JCT−VC)、JCTVC−E380、ジュネーブ、スイス、2011年3月16〜23日に記載されているように、2次変換は、回転変換(ROT)であり得る。ROTは、1次変換を置き換えない。しかしながら、ROTは、変換係数行列の低周波数部分だけに2次変換として適用される。上記で説明したROTでは、イントラコード化TUごとに、4つのあらかじめ定義された変換候補からどのROTが適用されるのかを示すインデックスがシグナリングされる。4×4の2次変換は、4×4のイントラコード化TUに適用され、一方、8×8の2次変換は、8×8およびそれよりも大きいイントラコード化TUに適用される。たとえば、本例では、2次変換は、次のように指定され得る。
[0110]上記に示した4つの変換候補において、1つの候補は、2次変換を適用しないことに対応し、他の3つの候補は、α1,α2,...,α6の3つの異なる設定によって生成されたRverticalおよびRhorizontalに対応する。より詳細な説明は、K.McCann、W.−J.Han、I.−K.Kim、J.−H.Min、E.Alshina、A.Alshin、T.Lee、J.Chen、V.Seregin、S.Lee、Y.−M.Hong、M.−S.Cheon、N.Shlyakhov、「Video coding technology proposal by Samsung(and BBC)」ITU−T SG16 WP3とISO/IEC JTC1/SC29/WG11とのビデオコーディング共同研究部会(JCT−VC)、JCTVC−A124、ドレスデン、ドイツ、2010年4月15〜23日に見いだされ得る。
[0111]図4は、ビデオデコーダ30などのビデオデコーダによって適用される例示的なROTの図である。図4の例では、ビデオデコーダは、4×4から32×32までのサイズにわたる変換係数ブロック62に対して逆量子化60(Inv Q)を実行する。さらに、図4の例では、ビデオデコーダは、変換係数行列の低周波数部分だけに2次変換として逆ROT64(Inv ROT)を適用する。たとえば、図4の例に示すように、4×4および8×8の変換係数行列のすべての変換係数は、変換係数行列の低周波数部分中にあると見なされ得る。しかしながら、図4に示すように、16×16および32×32の変換係数行列の左上の8×8のサブブロック中の変換係数のみが変換係数行列の低周波数部分中にあると見なされる。さらに、図4の例では、ビデオデコーダは、変換係数行列を残差ブロックに変換するために変換係数行列に逆DCT変換66(Inv DCT変換)を適用する。図4の例では、16×16および32×32の変換係数行列に逆DCT変換66を適用する前に、ビデオデコーダは、16×16および32×32の変換係数行列の左上の8×8のサブブロックを、逆ROT64の適用によって生成される対応する8×8の変換係数行列に置き換え得る。
[0112]E.Alshina、A.Alshin、J.−H.Min、K.Choi、A.Saxena、M.Budagavi、「Known tools performance investigation for next generation video coding」、ITU−T SG16 Doc.VCEG−AZ05、2015年6月に記載されているように、ROTは、低周波数部分だけでなく、TU全体に拡張され得る。より詳細には、3つの4×4の分離可能2次変換候補があらかじめ定義され得、選択された1つが、CUレベルで2ビットのインデックスを用いて明示的にシグナリングされ得る。2ビットのインデックスを、本明細書では、ROTインデックスと呼ぶことがある。一例では、ROTインデックスが0であるとき、2次変換は適用されない。しかしながら、この例では、ROTインデックスが1、2および3であるとき、3つのあらかじめ定義された2次変換候補のうちの1つに対応する2次変換が、現在のCU内のあらゆるTUに適用され得る。選択された2次変換を仮定すれば、現在のTUのあらゆる4×4のサブブロックに、2次4×4分離可能2次変換が適用され得る。
[0113]2次変換の設計は、2次変換として分離可能変換を適用し得る。しかしながら、非分離可能変換が2次元画像ブロックに対して優れたコーディング利得を与え得るので、2次変換効率は改善され得る。言い換えれば、ビデオコーディングのシナリオでは、変換係数は、ほぼ非相関であり、疎であり得、したがって、入力ベクトルxのエネルギーは、数個の変換係数だけに圧縮され得、残りの大多数の変換係数は一般に0に近くなり得る。本例では、非分離可能変換であるKLTは、ピクセル領域から周波数領域に係数を単に変換するのではなく、変換基底ベクトルとして入力データの共分散行列の固有ベクトルを使用するので、最適なエネルギー圧縮を有し得る。
[0114]より詳細には、分離可能変換は、水平および/または垂直方向に沿ったピクセル相関を捕らえ得る。対照的に、非分離可能変換は、2次元画像ブロック中の2つのピクセルの任意のペアの間の相関を捕らえ得る。したがって、非分離可能変換は、分離可能変換よりもデータ相関を低減するさらなる柔軟性を有し得る。たとえば、非水平方向または非垂直方向に沿った相関を示す画像ブロック、たとえば、45度のエッジテクスチャの場合、分離可能変換は、45度方向に沿ったピクセル間の相関を低減するのに効率的でないことがあるが、非分離可能は、相関を効率的に低減し得る。
[0115]上記で説明した問題に鑑みて、以下の技法が提案される。以下で説明する本開示の技法が、米国特許出願第15/006,994号および米国仮出願第62/108,491号に記載されている技法など、適応型成分間残差予測のための技法と連携して使用され得ることを理解されたい。以下のテキストに、本開示で提案する項目別にあげる技法について説明する。ビデオエンコーダ20および/またはビデオデコーダ30は、項目別にあげる技法を個々に適用し得る。代替的に、ビデオエンコーダ20および/またはビデオデコーダ30は、項目別にあげる技法の任意の組合せを適用し得る。
[0116]第1の技法によれば、ビデオエンコーダ20および/またはビデオデコーダ30は、量子化プロセスと変換プロセスとの間に非分離可能2次変換を適用するように構成される。たとえば、平面モードに適用される(3つの非分離可能変換を含む)非分離可能変換セットは、次の通りであり得る。
[0117]この例の一態様では、非分離可能2次変換は、KLTであり得、これは、オフライントレーニングから導出されるか、または仮定画像相関モデルを使用してオフラインで分析的に導出され得る。いくつかの例では、画像相関モデルは、関数f(x,y)であり、これは、ランダムベクトルのi番目の要素とj番目の要素との間の共分散を測定する。ランダムベクトルは、複数の次元をもつランダム変数であり得る。言い換えれば、画像相関関数は対称f(x,y)=f(y,x)であり得、共分散行列Cov(x,y)=f(x,y)は、半正定値であり得る。相関モデルの一例は、f{x*y}=ρ|x-y|であり、ここで、0≦ρ≦1である。
[0118]この例の一態様では、非分離可能2次変換は、KLTであり得、これは、オフライントレーニングから導出されるか、または符号化/復号プロセス中にオンラインで導出されたKLTを使用してオフラインで分析的に導出され得る。いくつかの例では、符号化/復号プロセス中に、ビデオエンコーダ20および/またはビデオデコーダ30は、変換係数の統計値を収集し、2次変換が適用される場合、変換係数の相関行列が更新されるように構成される。更新された相関行列に基づいて、ビデオエンコーダ20および/またはビデオデコーダ30は、固有ベクトルを抽出し、それらの対応する固有値の順序に配列されるすべての固有ベクトルから構成される行列としてKLT変換コアを導出するように構成され得る。
[0119]第1の技法の一例によれば、ビデオエンコーダ20は、残差ビデオブロックを形成し得る。いくつかの例では、残差ビデオブロックを形成することの一部として、ビデオエンコーダ20は、コーディングされているビデオブロックから1つまたは複数の予測ブロックを減算する。さらに、ビデオエンコーダ20は、第1の係数ブロックを生成するために残差ビデオブロックに第1の変換を適用し得る。この例では、第1の変換は、ピクセル領域から周波数領域に残差ビデオブロックを変換する。本明細書では、ピクセル領域または空間領域は、ピクセルの値の変化がそのピクセルの輝度および/または色の変化に対応する領域を指すことがある。ただし、本明細書では、周波数領域は、ピクセルの値の変化がピクセルのピクセル値がピクセル領域中で変化する速度の変化に対応する領域を指すことがある。さらに、ビデオエンコーダ20は、第2の係数ブロックを生成するために第1の係数ブロックの少なくとも一部に2次変換を適用し得る。本開示の第1の技法によれば、第2の変換は、KLTなどの非分離可能変換である。ビデオエンコーダ20は、次いで、第2の係数ブロックを量子化し得る。
[0120]同様に、第1の技法の一例によれば、ビデオデコーダ30は、第1の係数ブロックを逆量子化し得る。さらに、この例では、ビデオデコーダ30は、第2の係数ブロックを生成するために、逆量子化された第1の係数ブロックの少なくとも一部に第1の逆変換(すなわち、逆2次変換)を適用し得る。本開示の第1の技法によれば、第1の逆変換は、KLTなどの非分離可能変換である。さらに、この例では、第2の係数ブロックを生成するために第1の逆変換を適用した後に、ビデオデコーダ30は、残差ビデオブロックを生成するために、第2の係数ブロックに第2の逆変換を適用し得る。この例では、第2の逆変換は、周波数領域からピクセル領域に第2の係数ブロックを変換する。さらに、この例では、ビデオデコーダ30は、復号ビデオブロックを形成し得る。いくつかの例では、復号ビデオブロックを形成することの一部として、ビデオデコーダ30は、1つまたは複数の予測ブロックを残差ビデオブロックに加算する。たとえば、ビデオデコーダ30は、1つまたは複数の予測ブロックを残差ビデオブロックに加算し、1つまたは複数の予測ブロックとの残差ビデオブロックの加算に基づいて復号ビデオブロックを形成し得る。
[0121]第2の技法によれば、ビデオエンコーダ20および/またはビデオデコーダ30は、非分離可能変換のサブセットを構築するために、3つ以上の非分離可能変換候補からの事前選択を実行する。いくつかの例では、非分離可能変換のサブセットは、オフライントレーニングによって導出されるKLTを指すことがあり、変換コアは、エンコーダ20および/またはデコーダ30の両方について固定数としてハードコーディングされる。ビデオエンコーダ20および/またはビデオデコーダ30は、変換のサブセットから現在のTUのために使用されるべき最終変換を選定し得る。
[0122]たとえば、ビデオエンコーダ20は、3つ以上の非分離可能変換候補を含む非分離可能変換のセットのサブセットを構築し得る。この例では、ビデオエンコーダ20は、第1の逆変換として非分離可能変換のセットのサブセットから1つの候補を選択し得る。この例のいくつかの態様では、非分離可能変換のセットは、12個の変換サブセットを含み、12個の変換サブセットは、非分離可能変換のセットのサブセットを含む。この例のいくつかの態様では、非分離可能変換のセットは、ビデオデータのためのルーマイントラ予測モードによって指定される。たとえば、ビデオエンコーダ20は、ビデオデータのための第1のルーマイントラ予測モードが非分離可能変換の第1のセットとともに使用されることを指定し得、ビデオデータのための第2のルーマイントラ予測モードが非分離可能変換の第2のセットとともに使用されることを指定し得る。より詳細には、ビデオエンコーダ20は、シグナリングされたインデックス(たとえば、インデックスを示すデータ)と選択された変換サブセットとによって変換候補を指定し得る。
[0123]同様に、ビデオデコーダ30は、3つ以上の非分離可能変換候補を含む非分離可能変換のセットのサブセットを構築し得る。この例では、ビデオデコーダ30は、第2の変換として非分離可能変換のセットのサブセットから1つの候補を選択し得る。この例のいくつかの態様では、非分離可能変換のセットは、12個の変換サブセットを含み、12個の変換サブセットは、非分離可能変換のセットのサブセットを含む。この例のいくつかの態様では、非分離可能変換のセットは、ビデオデータのためのルーマイントラ予測モードによって指定される。
[0124]一例では、変換のサブセットを構築する事前選択は、イントラ予測モード、EMTのCUレベルのおよび/またはTUレベルのインデックス、RQT深度、量子化係数、基準予測ブロック、PU内の現在のTUの相対ロケーション(TUが現在のPUのどの境界に位置しているのか)、ブロックサイズ、ブロック形状(それが正方形ブロックであるのかまたは非正方形ブロックであるのか、および高さと幅の比率)などの復号済み情報によって決定され得る。言い換えれば、ビデオデコーダ30は、別個のまたは追加のシグナリングに依拠するのではなく、復号情報に従って変換のサブセットをあらかじめ選択し得る。たとえば、ビデオエンコーダ20は、復号情報に基づいてサブセットを決定し得、復号情報は、イントラ予測モードと、CUレベルのEMTインデックスと、TUレベルのEMTインデックスと、残差4分木深度と、量子化係数と、基準予測ブロックと、PU内の現在のTUの相対ロケーションとのうちの1つまたは複数を備える。この例のいくつかの態様では、12個の変換サブセットが適用され、イントラ予測モードから変換サブセット選択へのマッピングを指定するルックアップテーブルがあらかじめ定義されており、イントラ予測モードとこのルックアップテーブルとが与えられれば、3つの異なる非分離可能変換を含む変換サブセットが、最初に選択され、次いで、3つの非分離可能変換のうちの1つが、さらに、復号情報によって指定され、第1の変換を実行するために使用される。同様に、この例のいくつかの態様では、ビデオデコーダ30は、イントラ予測モード、CUレベルのEMTインデックス、TUレベルのEMTインデックス、残差4分木深度、量子化係数、基準予測ブロック、単位PU内の現在のTUの相対ロケーション、ブロックサイズ、およびブロック形状(それが正方形ブロックであるのかまたは非正方形ブロックであるのか、および高さと幅の比率)のサブセットベースの1つまたは複数を決定し得る。
[0125]第2の技法のいくつかの例によれば、変換のサブセットの数は、小さい整数、たとえば、1、2、3、4、12、または34に限定され得る。さらに、この例のいくつかの態様では、変換の異なるサブセットは、異なるタイプの変換を含み得る。たとえば、ビデオエンコーダ20は、あらかじめ選択されたサブセットとして1つまたは複数の左変換を有する第1のサブセット、オアモアな右変換を有する第2のセット、または左右の変換を有する第3のセットをあらかじめ選択し得る。次いで、本例では、ビデオエンコーダ20は、選択された変換としてあらかじめ選択されたサブセットから1つの変換候補を選択し得る。たとえば、ビデオエンコーダ20は、エンコーダモード決定を使用して変換を選択し得、ビデオエンコーダ20は、変換のインデックスを示すデータを符号化する。同様に、ビデオデコーダ30は、ビットストリームからインデックスを復号し、あらかじめ選択された変換のセットから復号されたインデックスに基づいて変換を選択し得る。
[0126]いくつかの例では、異なるイントラ予測モードに対応する非分離可能変換のセットの変換サブセット中の変換候補の総数が異なる。たとえば、ビデオエンコーダ20および/またはビデオデコーダ30は、第1のイントラ予測モードのために第1のサブセットを使用し、第2のイントラ予測モードのために第2のサブセットを使用し得る。
[0127]一例では、合計12個の変換サブセットがある。この例では、12個の変換サブセットのそれぞれの変換サブセットは、3つの非分離可能変換候補を含んでいる。変換サブセットは、ルーマイントラ予測モードによって指定され得、異なるイントラモードに対して、同じ変換セットが適用され得る。本明細書では、イントラ予測モードは、予測されているブロックのための予測の様々な方向を指すことがある。イントラ予測モードの例としては、限定はしないが、垂直、水平、対角左下、対角右下、垂直右側、水平下側、垂直左側、水平上側、および予測されているブロックのための予測の他の方向があり得る。言い換えれば、この例のいくつかの態様では、非分離可能変換のセットは、ビデオデータのためのルーマイントラ予測モードによって指定される。たとえば、ビデオデコーダ30は、特定のルーマイントラ予測モードのために12個の変換サブセットのうちの1つの変換サブセットを選択し得る。本例の一態様では、ビデオデコーダ30は、第1のイントラ予測モードのために選択されたサブセット中に含まれている3つの非分離可能変換候補の第1の変換を選択し得、第2のイントラ予測モードのために選択されたサブセット中に含まれている3つの非分離可能変換候補の第2の変換を選択し得る。
[0128]一例では、合計12個の変換サブセットがあり、各変換サブセットは、5つの非分離可能変換候補を含み得る。変換セットは、ルーマイントラ予測モードならびにEMTのCUレベルのインデックスおよびTUレベルのインデックスによって指定され得る。異なるイントラモードに対して、同じ変換セットが適用され得る。
[0129]一例では、変換サブセットは、ただ1つの変換を含み得る。異なるTUサイズに対して、変換サブセット中の変換の数が異なり得、典型的な数オブは、限定はしないが、2、3および4であり得る。異なるイントラ予測モードに対して、変換サブセット中の変換の数が異なり得、典型的な数は、限定はしないが、2、3および4であり得る。本例の一態様では、平面またはDC予測モードでは、変換サブセット中の変換の数は2であり、一方、他の予測モードでは、変換サブセット中の変換の数は3である。
[0130]図5および図6は、本開示の第3の技法に関係する。図5は、2次変換係数再編成プロセスを含む例示的な符号化プロセスの一部を示すブロック図である。図6は、2次変換係数再編成プロセスを含む例示的な復号プロセスの一部を示すブロック図である。図5では、ビデオエンコーダ20は、2次元係数ブロック102を生成するために残差ブロック101に1次変換100を適用する。さらに、図5の符号化プロセスは、非分離可能2次変換106を含む。非分離可能2次変換106は、入力として1次元係数ベクトル156をとり、出力としてインア1次元係数ベクトル108を生成し得る。したがって、図5の例では、1次変換100は、2次元係数ブロック102を生成するが、非分離可能2次変換106は、入力として1次元係数ベクトルをとる。したがって、ビデオエンコーダ20は、2次元係数ブロック102を1次元係数ベクトル105に変換するために再編成プロセス104を実行し得る。いくつかの例では、再編成プロセス104は、非分離可能2次変換106の一部であると見なされ得る。
[0131]さらに、量子化プロセス114は、入力として2次元係数ブロック112をとり得、量子化された2次元係数ブロック116を出力し得る。したがって、本開示の第3の技法によれば、ビデオエンコーダ20は、ビデオエンコーダ20が符号化中に2次変換106を適用した後、2次元係数ブロック112として非分離可能2次変換106によって導出された1次元係数ベクトル108を再編成するために2次変換係数再編成プロセス110を適用し得る。再編成プロセス110を適用することは、1次元係数ベクトルを受け入れるために量子化プロセス106を変更する必要をなくし得る。
[0132]図6では、ビデオデコーダ30は、2次元係数ブロック152を導出するために、量子化された2次元係数ブロック151に逆量子化150を適用し得る。さらに、図6の復号プロセスは、逆2次変換158を含む。逆2次変換158は、入力として1次元係数ベクトル156をとり、1次元係数ベクトル160を出力し得る。たとえば、逆2次変換158は、入力として16×1の係数ベクトルをとり得、16×1の係数ベクトルを出力し得る。ただし、逆量子化150は、2次元係数ブロック152を出力し得、1次逆変換166は、入力として2次元係数ブロック164をとり得る。したがって、本開示の第3の技法によれば、ビデオデコーダ30が復号プロセス中に2次逆変換158を適用する前に、ビデオデコーダ30は、1次元係数ベクトル156として逆量子化150によって導出された2次元係数ブロック152を再編成するために2次変換係数再編成プロセス154を適用し得る。逆2次変換158を適用する前に再編成プロセス154を適用することは、1次元係数ベクトルを生成するために逆量子化150を変更する必要をなくし得る。さらに、ビデオデコーダ30は、2次元係数ブロック164として1次元係数ベクトル160を再編成するために2次変換係数再編成プロセス162を適用し得る。ビデオデコーダ30は、次いで、残差ブロック168を生成するために2次元係数ブロック164に1次逆変換166を適用し得る。1次逆変換166を適用する前に再編成プロセス162を適用することは、1次逆変換166を変更する必要をなくし得る。いくつかの例では、再編成プロセス162は、2次逆変換158の一部と見なされる。
[0133]したがって、第3の技法によれば、ビデオエンコーダ20は、残差ビデオブロックを形成し得る。残差ビデオブロックを形成することの一部として、ビデオエンコーダ20は、コーディングされているビデオブロックから1つまたは複数の予測ブロックを減算し得る。さらに、ビデオエンコーダ20は、第1の2次元係数ブロック(たとえば、2次元係数ブロック102)を生成するために残差ビデオブロックの少なくとも一部に第1の変換(たとえば、1次変換100)を適用し得る。この例では、第1の変換は、ピクセル領域から周波数領域に残差ビデオブロックを変換する。さらに、ビデオエンコーダ20は、第1の1次元係数ベクトルとして第1の2次元係数ブロックを再編成し得る。本例では、ビデオエンコーダ20は、第2の1次元係数ベクトルを生成するために第1の1次元係数ベクトルの少なくとも一部に第2の変換を適用し得る。この例では、第2の変換は、非分離可能変換である。本例では、第2の変換は、非分離可能変換である。この例では、ビデオエンコーダ20は、係数走査順序に従って第2の2次元係数ブロックとして第2の1次元係数ベクトルを再編成し得る。
[0134]同様に、ビデオデコーダ30は、係数走査順序に従って第1の1次元係数ベクトル(たとえば、1次元係数ベクトル156)として、第1の2次元係数ブロック(たとえば、2次元係数ブロック152)を再編成し得る。この例では、ビデオデコーダ30は、第2の1次元係数ベクトル(たとえば、1次元係数ブロック160)を生成するために非分離可能変換行列に第1の1次元係数ベクトルを乗じることによって、第1の逆変換(たとえば、非分離可能2次逆変換158)を適用し得る。この例では、第1の逆変換は、非分離可能変換である。この例では、ビデオデコーダ30は、2次元係数ブロック(たとえば、2次元係数ブロック164)として第2の1次元係数ベクトルを再編成し得る。ビデオデコーダ30は、残差ビデオブロック(たとえば、残差ブロック168)を生成するために第2の2次元係数ブロックに第2の逆変換(たとえば、1次逆変換166)を適用し得る。この例では、第2の逆変換は、周波数領域からピクセル領域に第2の2次元係数ブロックを変換する。この例では、ビデオデコーダ30は、復号ビデオブロックを形成し得る。復号ビデオブロックを形成することの一部として、ビデオデコーダ30は、1つまたは複数の予測ブロックを残差ビデオブロックに加算し得る。
[0135]第3の技法のいくつかの例では、第2の変換を適用することは、2次元変換行列に第1の1次元係数ベクトルを乗じることを備える。本例のいくつかの例では、第1の2次元係数ブロックは、4×4のブロックであり、2次元変換行列は、ルーマイントラ予測モードとコーディングユニットレベルのインデックスとによって選択される16×16の非分離可能変換行列である。たとえば、ビデオエンコーダ20は、16×16の非分離可能変換行列に第1の1次元係数ベクトル(たとえば、1次元係数ベクトル105)を乗じることによって、第2の変換(たとえば、非分離可能2次変換106)を適用し、それによって、第2の1次元係数ベクトル(たとえば、1次元係数ベクトル108)を生成し得る。同様に、ビデオデコーダ30は、16×16の非分離可能変換行列に第1の1次元係数ベクトル(たとえば、1次元係数ベクトル156)を乗じることによって、第2の変換(たとえば、非分離可能2次変換158)を適用し、それによって、第2の1次元係数ベクトル(たとえば、1次元係数ベクトル160)を生成し得る。
[0136]第3の技法のいくつかの例では、4×4の係数グループに対して実行される2次変換係数再編成プロセスは、4×4の係数グループの係数走査順序に依存し得る。たとえば、ビデオエンコーダ20が、エントロピー符号化中に4×4の係数グループの係数を表すシンタックス要素を処理するためにジグザグ走査順序を使用する場合、ビデオエンコーダ20は、非分離可能2次変換を適用することの一部として4×4の係数グループを16×1の係数ベクトルに再編成するときに同じジグザグ走査順序を使用し得る。
[0137]さらに、第3の技法のいくつかの例では、ビデオエンコーダ20は、4×4の係数グループのための係数走査順序を決定し得る。この例では、ビデオエンコーダ20は、決定された係数走査順序に基づいて第1の2次元係数ブロック(たとえば、4×4の係数グループ)として第1の1次元係数ベクトルを再編成し得る。この例のいくつかの態様では、ビデオエンコーダ20は、第1の2次元係数ブロックが決定された係数走査順序に対応する(たとえば、一致する)係数走査順序を有するように、第1の2次元係数ブロックとして第1の1次元係数ベクトルを再編成し得る。
[0138]同様に、ビデオデコーダ30は、4×4の係数グループのための係数走査順序を決定し得る。この例では、ビデオデコーダ30は、決定された係数走査順序に基づいて第2の1次元係数ベクトルとして第2の2次元係数ブロック(たとえば、4×4の係数グループ)を再編成し得る。この例のいくつかの態様では、ビデオデコーダ30は、第2の1次元係数ベクトルが決定された係数走査順序に対応する(たとえば、一致する)係数走査順序を有するように、第2の1次元係数ベクトルとして第2の2次元係数ブロックを再編成し得る。
[0139]第3の技法のいくつかの例では、4×4の係数グループに対して実行される2次変換係数再編成プロセスは、イントラ予測モード、EMTのCUレベルのおよび/またはTUレベルのインデックス、RQT深度、ならびに/あるいは量子化係数などの符号化/復号済み情報に依存し得る。言い換えれば、ビデオエンコーダ20の再編成プロセス110は、イントラ予測モード、EMTのCUレベルのおよび/またはTUレベルのインデックス、RQT深度、ならびに/あるいは量子化係数に基づいて、2次元係数ブロック112として1次元係数ベクトル108を再編成し得る。たとえば、ビデオエンコーダ20は、1次元係数ベクトルが係数走査順序対応(たとえば、一致)の決定済み係数走査順序を有するように垂直ルーマ予測モードが選択されるのか、または水平ルーマ予測モードが選択されるのかに基づいて2次元係数ブロック112として1次元係数ベクトル108を再編成し得る。同様に、ビデオデコーダ30の再編成プロセス154は、イントラ予測モード、EMTのCUレベルのおよび/またはTUレベルのインデックス、RQT深度、ならびに/あるいは量子化係数に基づいて、1次元係数ベクトル156を生成するために2次元係数ブロック152を再編成し得る。
[0140]第3の技法の一例では、特定の4×4の係数ブロックに非分離可能2次変換(たとえば、2次変換102)を適用した後に、ビデオエンコーダ20は、16×1の係数ベクトル(たとえば、1次元係数ベクトル108)を導出し得、特定の4×4のブロックのための係数走査順序に従って(すなわち、それに沿って)4×4のブロック(たとえば、2次元係数ブロック112)として得られた16個の係数を再編成し得る。ビデオエンコーダ20は、より小さいインデックスをもつ係数が4×4の係数ブロック中でより小さい走査インデックスをもつロケーションに配置される方法で16個の係数の再編成を実行し得る。たとえば、4×4の係数ブロックが、(たとえば、イントラ予測モードに従って)4×4の係数ブロックの上部から4×4の係数ブロックの下部に向かって行ごとに走査されるとき、ビデオエンコーダ20は、1次元係数ベクトルの最初の4つの係数として係数ブロックの最上行の4つの係数を再編成し、1次元係数ベクトルの次の4つの係数として係数ブロックの上から2番目の行の4つの係数を再編成し、以下同様に行い得る。
[0141]TU係数に対して逆量子化を実行した後に、ビデオデコーダ30は、現在のTUの各4×4のサブブロックについて、4×4の逆量子化された2次変換係数ブロック(たとえば、2次元係数ブロック152)を導出し得る。さらに、現在のTUのそれぞれの4×4のサブブロックについて、ビデオデコーダ30は、4×4のブロックのための係数走査順序に基づいてそれぞれの16×1のベクトル(たとえば、1次元係数ベクトル156)としてそれぞれの4×4の逆量子化されたブロック中の16個の係数を再編成し得る。ビデオデコーダ30は、より小さい走査インデックスをもつ係数が16×1の係数ベクトル中でより小さいインデックスをもつロケーションに配置される方法で4×4の係数の再編成を実行し得る。
[0142]一例では、ビデオエンコーダ20および/またはビデオデコーダ30は、固定の4×4の係数走査順序、たとえば、水平、垂直、対角、またはジグザグ走査順序に基づいて再編成プロセスを実行し得る。このようにして、16×1の係数ベクトル中でより小さいインデックスをもつ16個の2次変換係数は、固定のあらかじめ定義された4×4の係数走査順序に従って4×4の係数ブロック中に配置され得る。
[0143]第3の技法の一例によれば、変換プロセス(たとえば、1次変換100)の後に、ビデオエンコーダ20は、最初に、
を使用してベクトル
としてBを表し、次いで、以下の計算を実行することによって、現在のM×NのTUのそれぞれの4×4の変換係数サブブロックBに2次変換(たとえば、2次変換102)を適用し得る。
上記の式中で、Tは、上記で説明したように、ルーマイントラ予測モードとシグナリングされたCUレベルのフラグとに基づいて選択された16×16の非分離可能変換行列である。さらに、図5の例では、
は、1次元係数ベクトル105に対応し得る。上記の式を適用したことの結果として、それぞれの4×4のサブブロックについて、ビデオエンコーダ20は、それぞれの16×1の2次変換係数ベクトル
を導出する。図5の例では、
は、1次元係数ベクトル108に対応する。ビデオエンコーダ20は、以下の演算を実行することによってそれぞれの4×4の係数ブロックとしてそれぞれの16×1の2次変換係数ベクトルを再編成し得る。
上記の式中で、j=0,1,...,15であり、scan_xおよびscan_yは、それぞれ、HEVCにおいてすでに定義されているx座標およびy座標のための走査表であり得る。このようにして、それぞれの4×4の変換係数サブブロックBは、それぞれの導出された2次4×4変換係数ブロックFによって置き換えられ得る。図5の例では、Fは、2次元係数ボック112に対応する。ビデオエンコーダ20が、各4×4の変換係数サブブロックに対して2次変換を実行した後、ビデオエンコーダ20は、さらに、更新されたM×Nの係数ブロックを量子化し、エントロピー符号化し得る。
[0144]それぞれの4×4の係数サブブロックFについて、量子化プロセス(たとえば、逆量子化150)の後に、ビデオデコーダ30は、16×1のベクトルにそれぞれの4×4の係数サブブロックFを再編成することによって、16×1の2次変換係数ベクトル
を導出し得る。
[0145]上記のこの式中で、j=0,1,...,15であり、scan_xおよびscan_yは、それぞれ、HEVCにおいてすでに定義されている4×4の係数サブブロックFのx座標およびy座標のための走査表である。図6の例では、
は、1次元係数ベクトル156に対応し、Fは、2次元係数ブロック152に対応する。ビデオデコーダ30は、次いで、以下の計算を実行することによって
に対して逆2次変換(たとえば、2次逆変換158)を適用し得る。
[0146]上記の式中で、T’は、上記で説明したように、ルーマイントラ予測モードとシグナリングされたCUレベルのフラグとによって選択され得る16×16の非分離可能変換行列である。上記の式の行列乗算の結果として、それぞれの4×4のサブブロックiについて、ビデオデコーダ30は、それぞれの16×1の2次変換係数ベクトル
を導出する。図6の例では、
は、1次元係数ベクトル160に対応する。ビデオデコーダ30は、
を計算することによって4×4の係数ブロックとして16×1の2次変換係数ベクトルを再編成する。図6の例では、Bは、2次元係数ブロック164に対応する。ビデオデコーダ30は、4×4の変換係数サブブロックFを導出された2次4×4変換係数ブロックBと置き換え得る。ビデオデコーダ30が4×4係数サブロックの各々に対して逆2次変換を実行した後、ビデオデコーダ30は、逆変換(たとえば、1次逆変換166)に更新されたM×Nの係数ブロックを入力し得る。
[0147]上記のように、いくつかの例では、ビデオエンコーダ20は、非分離可能2次変換を選択し得る。第4の技法によれば、ビデオエンコーダ20は、TU、PU、CUまたは任意の画像コーディングブロックユニットに適用可能なインデックスを使用する非分離可能2次変換の選択の指示をシグナリング(たとえば、符号化)し得、ビデオデコーダ30は、それを受信し得る。言い換えれば、ビデオエンコーダ20は、TU、PU、CUまたは他の画像コーディングブロックユニットについて、選択された非分離可能2次変換を示すインデックスを示すデータを符号化し得る。たとえば、非分離可能変換のセットからの第1の逆変換の選択は、TU、PU、CU、またはそれらの組合せのためのインデックスによってシグナリングされ得る。同様に、ビデオデコーダ30は、ビデオデータのビットストリームから、TU、PU、CU、またはそれらの組合せのためのインデックスを示すデータを取得し、インデックスは、選択された非分離可能2次変換を示し得る。説明を簡単にするために、本開示は、選択された非分離可能2次変換を示すインデックスを非分離可能2次変換(NSST:non-separable secondary transform)インデックスと呼ぶことがある。
[0148]いくつかの例では、ビデオエンコーダ20は、NSSTインデックスをエントロピー符号化し得る。NSSTインデックスをエントロピー符号化することの一部として、ビデオエンコーダ20は、NSSTインデックスを2値化し得る。NSSTインデックスをエントロピーコーディングする場合、2値化のために固定長コードが使用され得、2値化のために短縮単項コードまたは指数ゴロムコードなどの可変長コードが使用され得る。
[0149]第5の技法によれば、残差信号のエネルギーが限定されている場合、ビデオエンコーダ20は、いくつかのTUについて、NSSTインデックスのシグナリングをスキップし得、2次変換が、適用されないことがある。たとえば、現在のTUのために送信された非ゼロ係数がない場合、ビデオエンコーダ20は、現在のTUについてNSSTインデックスのシグナリングをスキップし得る。言い換えれば、現在のTUのために符号化された非ゼロ係数がない場合、ビデオエンコーダ20は、現在のTUについてNSSTインデックスを示すデータの符号化をスキップし得る。同様に、他の例では、NSSTインデックスシグナリングのスキップは、LCU、CU、PU、または任意の他のブロックレベルのシンタックス要素に適用され得る。したがって、第5の技法によれば、ビデオエンコーダ20は、ビデオデータの符号化ビットストリーム中で、TU、PU、CU、またはそれらの組合せに適用可能なインデックスを示すデータを生成し、インデックスは、選択された候補が第2の変換であることを示し得る。
[0150]同様に、ビデオデコーダ30は、ビデオデータのビットストリームから、TU、PU、CU、またはそれらの組合せに適用可能なインデックスを示すシンタックス要素を取得し得る。この例では、ビデオデコーダ30は、第1の逆変換として、インデックスによって示される候補を選択することを備える、非分離可能変換のサブセットから候補を選択し得る。
[0151]いくつかの例では、あるブロックレベルで送信される非ゼロ係数の総数または総絶対値和または2乗値の和が所与のしきい値よりも大きくない場合、そのあるブロックレベルのNSSTインデックスは、スキップされ、2次変換が適用されない。たとえば、あるLCUで送信される非ゼロ係数の総数が10よりも大きくないとき、ビデオエンコーダ20は、NSSTインデックスのシグナリングをスキップし、2次変換を適用しないことがある。いくつかの例では、あるCUで送信される非ゼロ係数の総絶対値和が100よりも大きくないとき、ビデオエンコーダ20は、NSSTインデックスのシグナリングをスキップし、2次変換を適用しないことがある。一例では、あるPUで送信される非ゼロ係数の2乗値の和が100よりも大きくないとき、ビデオエンコーダ20は、NSSTインデックスのシグナリングをスキップし、2次変換を適用しないことがある。
[0152]したがって、第5の技法によれば、ビデオエンコーダ20は、ビットストリーム中の2次変換(たとえば、非分離可能2次変換106)のインデックスを符号化すべきかどうかを決定し得る。2次変換のインデックスは、複数の利用可能な2次変換の中から2次変換を識別し得る。この例では、ビデオエンコーダ20は、特定のブロックレベルで(たとえば、LCU、CU、PU、TU中で)送信される非ゼロ係数の総数の和、総絶対値和、または2乗値の和が所与のしきい値よりも大きくないことに基づいて2次変換のインデックスがビットストリーム中に符号化されていないと決定し得る。この例では、ビデオエンコーダ20は、特定のブロックレベルで2次変換のインデックスをシグナリングし得る。この例では、ビデオエンコーダ20は、2次元係数ブロックの少なくとも一部に、インデックスがビットストリーム中でシグナリングされる2次変換を適用し得る。
[0153]同様に、ビデオデコーダ30は、2次変換(たとえば、非分離可能逆変換158)のインデックスがビットストリーム中でシグナリングされるのかどうかを決定し得る。この例では、ビデオデコーダ30は、特定のブロックレベルの非ゼロ係数の総数の和、総絶対値和、または2乗値の和が所与のしきい値よりも大きくないことに基づいて2次変換のインデックスがビットストリーム中に符号化されていないと決定し得る。この例では、2次変換のインデックスは、特定のブロックレベルでシグナリングされる。この例では、ビデオデコーダ30は、1次元係数ベクトルに、ビットストリーム中でシグナリングされたインデックスによって示される2次変換の逆である2次逆変換を適用し得る。
[0154]一例では、2次元係数ブロックの非ゼロ係数の量がしきい値よりも大きくないとビデオエンコーダ20が決定したことに応答して、ビデオデコーダ30は、1次元係数ベクトルに2次逆変換を適用し得る。この例では、しきい値は、ビデオデータのブロックサイズ、イントラ予測モード、またはそれらの組合せごとに異なり得る。
[0155]同様に、ビデオエンコーダ20は、2次元係数ブロックの非ゼロ係数の量がしきい値よりも大きいかどうかを決定し得る。この例では、2次元係数ブロックの非ゼロ係数の量がしきい値よりも大きくないと決定したことに応答して、ビデオエンコーダ20は、2次元係数ブロックの少なくとも一部に2次変換を適用し得る。この例では、しきい値は、ビデオデータのブロックサイズ、イントラ予測モード、またはそれらの組合せごとに異なり得る。
[0156]いくつかの例では、非ゼロ係数の総数のしきい値は1である。一例では、非ゼロ係数の総数のしきい値は、ブロックサイズまたはイントラ予測モードごとに異なり得る。
[0157]いくつかの例では、ビデオエンコーダ20とビデオデコーダ30とは、すべての色成分(たとえば、Y、Cb、およびCr)の係数値に2次変換と2次逆変換とを適用し得る。他の例では、ビデオエンコーダ20とビデオデコーダ30とは、すべてではないが、いくつかの色成分に2次変換と2次逆変換とを適用し得る。たとえば、ビデオエンコーダ20とビデオデコーダ30とは、クロマ(たとえば、CbおよびCr)成分の係数値には適用しないが、ルーマ(すなわち、Y)成分の係数値に2次変換と2次逆変換とを適用し得る。ビデオエンコーダ20とビデオデコーダ30とが2つ以上の色成分に2次変換と2次逆変換とを適用する例では、NSSTインデックスは、2つ以上の色成分の間で共有され得る。
[0158]第5の技法の一例によれば、NSSTインデックスが、あるブロックレベルでシグナリングされ、いくつかの成分(たとえば、Y、Cb、Cr)の間で共有される場合、および同じNSSTインデックスを共有するすべての成分からそのあるブロックレベルで送信される非ゼロ係数の総数の和または総絶対値和または2乗値の和が、所与のしきい値よりも大きくない場合、NSSTインデックスは、スキップされ得、2次変換は適用されない。一例では、非ゼロ係数の総数のしきい値は、1、2、または3である。いくつかの例では、非ゼロ係数の総数のしきい値は3よりも大きい。
[0159]一例では、NSSTインデックスが、あるブロックレベルでシグナリングされ、Y、Cb、およびCr成分の間で共有される場合、Y、Cb、およびCr成分の非ゼロ係数の総数の和が所与のしきい値よりも小さい場合、NSSTインデックスは、スキップされ得、2次変換は、適用されないことがある。たとえば、Y、Cb、およびCr成分の組合せについてあるCUで送信される非ゼロ係数の絶対値和が100よりも大きくないとき、ビデオエンコーダ20は、NSSTインデックスのシグナリングをスキップし、2次変換を適用しないことがある。
[0160]一例では、NSSTインデックスが、あるブロックレベルでシグナリングされ、CbおよびCr成分の間で共有される場合、CbおよびCr成分の非ゼロ係数の総数の和が所与のしきい値よりも小さい場合、ビデオエンコーダ20は、NSSTインデックスのシグナリングをスキップし、2次変換を適用しないことがある。たとえば、あるCUのCbおよびCr成分のための非ゼロ係数の総数が3よりも大きくないとき、ビデオエンコーダ20は、NSSTインデックスのシグナリングをスキップし、2次変換を適用しないことがある。
[0161]第5の技法のいくつかの例によれば、非ゼロ係数の総数のしきい値は、ブロックサイズまたはイントラ予測モードごとに異なり得る。たとえば、LCUは、CUおよびPUよりも大きいしきい値を有し得る。同様に、ビデオエンコーダ20は、垂直イントラ予測モードを使用してコーディングされるブロックのために第1のしきい値を使用し得、水平イントラ予測モードを使用してコーディングされるブロックのために第2の異なるしきい値を使用し得る。
[0162]第5の技法の一例では、NSSTインデックスが、あるブロックレベルでシグナリングされ、Y、Cb、およびCr成分の間で共有される場合、Y成分のみの非ゼロ係数の総数が所与のしきい値よりも小さい場合、NSSTインデックスは、スキップされ得、2次変換は、適用されないことがある。たとえば、Y成分のみについてあるCUで送信される非ゼロ係数の総数が1、2、3、または別のしきい値よりも大きくないとき、ビデオエンコーダ20は、NSSTインデックスのシグナリングをスキップし、2次変換を適用しないことがある。
[0163]一例では、NSSTインデックスが、あるブロックレベルでシグナリングされ、CbおよびCr成分の間で共有される場合、Cb成分のみの非ゼロ係数の総数が所与のしきい値よりも小さい場合、NSSTインデックスは、スキップされ得、2次変換は、適用されないことがある。たとえば、Cb成分のみについてあるCUで送信される非ゼロ係数の総数が1、2、3、または別のしきい値よりも大きくないとき、ビデオエンコーダ20は、NSSTインデックスのシグナリングをスキップし、2次変換を適用しないことがある。同様に、Cr成分のみについてあるCUで送信される非ゼロ係数の総数が1、2、3、または別のしきい値よりも大きくないとき、ビデオエンコーダ20は、NSSTインデックスのシグナリングをスキップし、2次変換を適用しないことがある。
[0164]追加または代替として、第5の技法のいくつかの例では、非ゼロ係数の総数のしきい値は、ブロックサイズまたはイントラ予測モードごとに異なり得る。言い換えれば、LCUは、CUおよびPUよりも大きいしきい値を有し得る。同様に、16×16のクロマ予測モードは、4×4のクロマ予測モードよりも大きいしきい値を有し得る。たとえば、ビデオエンコーダ20は、垂直イントラ予測モードを使用してコーディングされるブロックのために第1のしきい値を使用し得、水平イントラ予測モードを使用してコーディングされるブロックのために第2の異なるしきい値を使用し得る。
[0165]第5の技法の一例では、LCU、CU、PU、または他のタイプのブロックのサイズが、あらかじめ定義されたしきい値よりも大きいかまたはそれよりも小さいか、あるいは所与のしきい値範囲内にあるとき、NSSTインデックスのシグナリングは、スキップされ得、2次変換は、適用されない。たとえば、CUのサイズが、8×8のあらかじめ定義された値よりも小さいとき、ビデオエンコーダ20は、符号化ビデオビットストリーム中に、NSSTインデックスを示すデータを生成することをスキップし、2次変換を適用しないことがある。
[0166]第5の技法の一例では、TUが変換スキップモードを使用してコーディングされるとき、NSSTインデックスのシグナリングは、スキップされ得、2次変換は適用されない。言い換えれば、TUが、変換スキップモードを使用してコーディングされるとき、ビデオエンコーダ20は、符号化ビデオビットストリーム中に、NSSTインデックスを示すデータを生成することをスキップし得、2次変換が適用されない。
[0167]たとえば、ビデオエンコーダ20は、TUが変換スキップモードでコーディングされていることに基づいてビットストリーム中で2次変換のインデックスをシグナリングする(たとえば、それを示すデータを符号化する)べきかどうかを決定し得る。この例では、ビデオエンコーダ20は、符号化ビデオビットストリーム中に、ビットストリーム中で2次変換のインデックスを示すデータを生成し、ビデオエンコーダ20は、第2の変換のインデックスを示すデータがビットストリーム中に符号化されていることに基づいて第1の2次元係数ブロックの少なくとも一部に2次変換を適用し得る。同様に、ビデオデコーダ30は、TUが変換スキップモードでコーディングされていることに基づいて2次変換のインデックスがビットストリーム中でシグナリングされるかどうかを決定し得る。言い換えれば、ビデオデコーダ30は、1次元係数ベクトルに、2次変換のインデックスによって示される2次逆変換を適用し得る。
[0168]さらに、第5の技法のいくつかの例では、ブロック(たとえば、TU)が2次変換を使用してコーディングされるとき、変換スキップモードがシグナリングされないことがある。言い換えれば、ビデオエンコーダ20は、符号化ビデオビットストリーム中に、データインディケィティブ、すなわち、変換スキップモードと2次変換とのうちの1つを生成し得る。たとえば、ビデオエンコーダ20は、符号化ビデオビットストリーム中に、変換スキップモードを示すデータを生成し、2次変換をシグナリングすることを省略し得る。同様に、ビデオエンコーダ20は、符号化ビデオビットストリーム中に、データインディケィティブ、すなわち、変換スキップモードを生成するのを省略し得、符号化ビデオビットストリーム中に、2次変換を示すデータを生成する。
[0169]本開示の第6の技法によれば、特定のコーディングモードでは、2次変換が、無効化され、および/またはシグナリングされず、その逆も同様であり得る。たとえば、そのようなコーディングモードは、必ずしも変換スキップモード、線形法(LM)モード、成分間残差予測モードなどを含み得るが、それらに限定されるとは限らない。したがって、2次変換が適用される場合、特定のコーディングモードは、無効化される、および/またはシグナリングされないことがある。たとえば、いくつかの例では、2次変換が適用されるとき、変換スキップモード、LMモード、および成分間残差予測モードは、無効化され得、ならびに/または変換スキップモード、LMモード、および成分間残差予測モードのインデックスは、符号化されない。同様に、変換スキップモード、LMモード、および成分間残差予測モードのうちの1つまたは複数が使用されるとき、2次変換は、無効化される、および/またはシグナリングされないことがある。概して、適応型成分間残差予測は、同じブロックのための別の色成分の残差から1つの色成分(たとえば、Y、Cr、またはCb)の残差を予測することを含み得る。
[0170]第6の技法の一例では、2次変換が有効化されると、特定のモードが常に無効化され得る。たとえば、2次変換が有効化されることに基づいて、変換スキップモードは、無効化される。
[0171]第6の技法の一例では、2次変換が有効化されると、特定のモードがいくつかの条件で無効化されるが、他の条件で有効化され得る。条件は、限定はしないが、ブロックサイズ、非ゼロ変換係数の数、コーディングがルーマ成分のためのものであるのか、またはクロマ成分のためのものであるのか、隣接予測モード、および他の条件を含み、その逆も同様であり得る。
[0172]第6の技法の一例では、2次変換が適用されるとき、特定の予測モードは、依然として、有効化され得るが、この特定の予測モードをシグナリングするために使用されるコンテキストモデリングは、シグナリングされる2次インデックス/フラグにコンテキストモデリングが依存するように変更され得る。言い換えれば、特定の予測モードは、2次変換が適用されるときに適用されるのを許可され得るが、特定の予測モードのためのコンテキストモデリングが変更される。
[0173]一例では、2次変換は、依然として、特定の予測モードのために有効化されるが、2次変換をシグナリングするために使用されるコンテキストモデリングは、特定の予測モードが適用されるのかどうかにコンテキストモデリングが依存するように変更され得る。言い換えれば、ビデオエンコーダ20および/またはビデオデコーダ30によって適用されない予測モードを無効化するのではなく、特定の予測モードは、2次変換が適用されるときに使用されるのを許可され得るが、特定の予測モードのためのコンテキストモデリングが変更される。
[0174]本開示の第7の例によれば、他の非ルーマ成分(たとえば、クロマ)に対して2次変換を適用するとき、および2次変換選択が、あるコード化情報への何らかの依存を有するとき、NSSTインデックス値は、コロケートされたルーマ成分から継承(たとえば、再使用)され、非ルーマ成分のために符号化されないことがある。そのようなコード化情報の例としては、限定はしないが、イントラ予測モードがあり得る。本明細書では、コロケートされたとは、同じブロックの構成要素を指すことがある。この例の態様では、あるコード化情報への依存は、コロケートされたルーマ成分のコード化情報を継承する代わりに非ルーマ成分のコード化情報が使用される方法で行われる。
[0175]一例では、2次変換がクロマ成分(たとえば、Cr成分および/またはCb成分)に対して実行され、ビデオデコーダ30が、シグナリングされたNSSTインデックスとイントラ予測モードとに基づいて2次変換を選択すると、クロマ成分について、ビデオデコーダ30は、コロケートされたルーマ成分のNSSTインデックスと現在のクロマ成分のイントラ予測モードとに基づいて2次変換を選択し得る。
[0176]クロマ成分のイントラ予測モードがコロケートされたルーマ成分(たとえば、Y成分)から継承されると、コロケートされたルーマ成分のイントラ予測モードは、2次変換を選択するために使用され得る。たとえば、ビデオデコーダ30は、コロケートされたルーマ成分のNSSTインデックスとコロケートされたルーマ成分のイントラ予測モードとに基づいてサブセットから2次変換候補を選択し得る。
[0177]一例では、たとえば、米国特許出願第15/006,994号に記載されているように、クロマ成分のイントラ予測モードがLMモードであるとき、2次変換はクロマ成分に適用されないことがある。たとえば、ビデオデコーダ30は、コロケートされたルーマ成分に2次変換候補を適用し、クロマ成分に2次変換候補を適用するのを控え得る。
[0178]一例では、2次変換が適用されるとき、LMモードは適用またはシグナリングされないことがある。この場合、イントラモードコーディングは、LMモードがシグナリングされるべき候補イントラモードでないように相応して変更され得る。そのようなイントラモードコーディングの変更は、限定はしないが、コーディングされるべき利用可能なイントラモードの数を低減すること、または利用可能なイントラモードの総数が同じになるようにLMモードを他のイントラ予測モードと置き換えることを含み得る。言い換えれば、2次変換が適用されるとき、LMモードは、候補イントラモードでないと推定され得るので、2次変換が適用されるとき、イントラモードのシグナリングは、LMモードをもはやシグナリングしないように変更され得る。
[0179]追加または代替として、クロマ成分のイントラ予測モードがLMモードであるとき、2次変換は、継承されたNSSTインデックスとクロマ成分のための平面/DCモードとを使用して選択され得る。たとえば、ビデオデコーダ30は、コロケートされたルーマ成分のNSSTインデックスとクロマ成分の平面/DCモードとに基づいてサブセットから2次変換候補を選択し得る。
[0180]一例では、コロケートされたルーマ成分のNSSTインデックスとイントラ予測モードとの両方が、現在の非ルーマ成分に継承され得る。たとえば、ビデオデコーダ30は、コロケートされた非ルーマ成分のNSSTインデックスとコロケートされた非ルーマ成分のイントラ予測モードとに基づいてサブセットから2次変換候補を選択し得る。
[0181]図7Aは、ルーマイントラモードから変換セットインデックスへの例示的なマッピングの図である。以下で説明する例は、ビデオエンコーダ20および/またはビデオデコーダ30によって実行され得る。図7Aに示すように、以下で説明する例は、平面(0)、DC(1)および65個の角度ルーマイントラ予測モード(2〜66)を含む67個のルーマイントラ予測モード上に実装され得る。非分離可能変換を実行するための変換行列を選択するために、合計12個の非分離可能16×16変換セットがあらかじめ定義され得る。各変換セットは、3つの16×16変換候補を含んでいる。一例では、変換セットは、ルーマイントラ予測モードによって指定され得る。たとえば、図7Aに示すように、ルーマイントラ予測モード「0」は、変換セットインデックス「0」を指定し、ルーマイントラ予測モード「1」は、変換セットインデックス「0」を指定し、ルーマイントラ予測モード「2」は、変換セットインデックス「1」を指定し、以下同様に行う。
[0182]図7Aの例では、変換セットが指定され得、各変換セット内で、3つの候補から選択された変換が、明示的にシグナリングされたCUレベルのROTインデックスによって指定され得る。たとえば、ROTインデックスは、ビットストリーム中でCUごとにシグナリングされるインデックス値であり得、ROTインデックス値は、0〜3にわたり得る。いくつかの例では、ROTインデックス0は、2次変換が適用されないことを指定し、ROTインデックス1〜3は、3つの異なるROTから選択された1つの変換を指定する。図7Aにおいて、ルーマ予測モードから変換セットインデックスへのマッピングが定義されている。
[0183]さらに、図7Aによれば、34よりも大きいルーマイントラ予測モード(IPM)について、イントラモード68−IPMのための同じ変換セットインデックスが適用され得る。ただし、イントラ予測モードIPMと68−IPMとの間の対称性を利用するために、エンコーダ/デコーダにおいて、2次変換を行う前に/後に変換係数ブロックが転置され得る。より詳細には、図7Bの例では、イントラ予測モード(IPM)は、0〜66にわたり得る。図7Bに示すように、イントラモードIPMと68−IPMとは対称である。たとえば、イントラモード18(水平予測)と50(垂直予測)とは対称である。IPMと68−IPMとが対称であるので、これらの2つのモードに適用される非分離可能変換は何らかの関係がある。たとえば、我々がモード50(垂直予測)から予測される残差ブロックを転置する場合、残差統計値は、モード18(水平予測)から予測される残差ブロックとほとんど同様であるはずである。したがって、イントラモードIPMのための非分離可能変換は、イントラモードIPMに転置演算を加えたもののための非分離可能変換と同様であるはずである。この対称性を利用し、非分離可能変換セットの総数を低減するために、34よりも大きいイントラモードIPMについて、68−IPMの同じ変換セットが使用され得、変換係数ブロックは、2次変換の後に転置され得る。JVET−C1001:http://phenix.it−sudparis.eu/jvet/doc_end_user/documents/3_Geneva/wg11/JVET−C1001−v3.zipのセクション2.2.1に、66個のルーマイントラ予測モードが記載されている。
[0184]本開示の第8の技法では、ビデオエンコーダ20および/またはビデオデコーダ30は、ブロックサイズごとに異なるサイズおよび異なる形状(正方形または非正方形以外)のNSSTを適用するように構成され得る。一例では、4×4のNSSTは、4×4のブロックに適用され得、8×8のNSSTは、8×8およびそれよりも大きいブロックについて左上の8×8の変換係数に適用され得る。たとえば、ビデオエンコーダ20は、4×4のブロックに4×4の2次変換を適用し得、8×8のブロックに8×8の2次変換を適用し得、8×8よりも大きいブロックの左上の8×8の係数に8×8の2次変換を適用し得る。たとえば、ビデオエンコーダ20は、16×16のブロックの左上の8×8の係数に8×8の2次変換を適用し得る。
[0185]第8の技法の一例では、4×4のNSSTがM×Nのブロックに適用されるとき、ここで、M≧4、N≧4、MおよびNは、4の倍数であり、M≠Nであり、M×Nのブロックは、複数の重複しない4×4のサブブロックによって分割され得る。各4×4のサブブロックに対して、4×4のNSSTが適用され得る。たとえば、ビデオエンコーダ20は、ビデオエンコーダ20が8×4のブロックの2つの4×4のブロックの各々にNSSTを適用するように、8×4のブロックの左上の4×4の係数に第1の4×4の2次変換を適用し、左上の4×4の係数の下にある8×4のブロックの4×4の係数に第2の4×4の2次変換を適用し得る。
[0186]たとえば、ビデオエンコーダ20は、M×Nの係数ブロックを複数の重複しない4×4のサブブロックに分割し得る。この例では、複数の重複しない4×4のサブブロックは、第1の2次元係数ブロックと第2の2次元係数ブロックとを含み、MおよびNはそれぞれ、4よりも大きく、MおよびNはそれぞれ、4の倍数であり、Mは、Nに等しくない。この例では、ビデオエンコーダ20は、複数の重複しない4×4のサブブロックのそれぞれの4×4のサブブロックに対して、それぞれの係数ブロックを生成するために2次変換を実行する。
[0187]同様に、ビデオデコーダ30は、M×Nの係数ブロックを複数の重複しない4×4のサブブロックに分割し得、複数の重複しない4×4のサブブロックは、第1の2次元係数ブロックを含み、MおよびNはそれぞれ、4よりも大きく、MおよびNはそれぞれ、4の倍数であり、Mは、Nに等しくない。この例では、ビデオデコーダ30は、複数の重複しない4×4のサブブロックの各4×4のサブブロックに対して4×4の逆NSSTを実行し得る。この例では、複数の4×4のサブブロックのそれぞれの4×4のサブブロックに対して、ビデオデコーダ30は、それぞれの2次元係数ブロックを生成するために逆2次変換を適用する。
[0188]第8の技法の一例では、8×8のNSSTがM×Nのブロックに適用されるとき、ここで、M≧8であり、N≧8であり、MおよびNは、8の倍数であり、M×Nのブロックは、複数の重複しない8×8のサブブロックに分割され得、各8×8のサブブロックに対して、8×8のNSSTが適用され得る。たとえば、ビデオエンコーダ20は、ビデオエンコーダ20が8×64のブロックの8つの8×8のブロックの各々にNSSTを適用するように、8×64のブロックの左上の8×8の係数に第1の8×8の2次変換を適用し、左上の8×8の係数の下にある8×64のブロックの8×8の係数に第2の8×8の2次変換を適用し、以下同様に行い得る。
[0189]第8の技法の一例では、正方形のNSSTの代わりに、NSSTは、係数ブロックの任意の領域に位置する変換係数のグループに適用され得る。たとえば、ビデオエンコーダ20は、8×64のブロックの中央の4×16の係数に第1の4×16の2次変換を適用し得る。一例では、係数走査順序で最初のK個の変換係数が単一のベクトルに編成され得、非分離可能変換は、この変換係数ベクトルに対して実行され得る。この例では、係数走査順序は、限定はしないが、対角走査、水平走査または垂直走査であり得る。
[0190]第8の技法の一例では、N×Nのブロックに対して、最初のM個の係数のみが計算されるようにゼロアウトNSSTが適用され得、残りのN−M個の係数は、0であると見なされ得る。たとえば、N個の係数を含む1次元係数ベクトルの場合、ビデオエンコーダ20は、1次元係数ベクトルのN個の係数の最初のM個のみを計算し、1次元係数ベクトルの残りの(すなわち、N−M個の)係数を0に設定するNSSTを適用し得る。
[0191]ゼロ化された係数のグループが係数グループ(CG)、たとえば、HEVCにおいて定義されている4×4のサブブロックを形成する場合、このCGをエントロピーコーディングするとき、このCG中に少なくとも1つの非ゼロ係数があるのかどうかをシグナリングするフラグがスキップされ、コーディングされないことがある。いくつかの例では、ゼロ化された係数のためのシンタックス要素をコーディングしないのではなく、ゼロ化された係数のためのシンタックス要素が、別個のコンテキストを使用するが、依然としてコーディングされ得る。
[0192]さらに、いくつかの例では、ゼロ化された係数のグループが係数グループ(CG)、たとえば、HEVCにおいて定義されている4×4のサブブロックを形成する場合、このCGをエントロピーコーディングするとき、最後の位置のコーディングは、最後の位置がこれらのゼロ化された係数位置に現れることができないという制限を含むように変更され得る。
[0193]図8は、本開示で説明する技法を実装し得るビデオエンコーダ20の一例を示すブロック図である。本開示によれば、ビデオエンコーダ20は、たとえば、2次変換に関係する技法など、本開示で説明する技法を適用するように構成され得る。ビデオエンコーダ20は、ビデオスライス内のビデオブロックのイントラコーディングおよびインターコーディングを実行し得る。イントラコーディングは、所与のビデオフレームまたはピクチャ内のビデオの空間冗長性を低減または除去するために空間的予測に依拠する。インターコーディングは、ビデオシーケンスの隣接するフレームまたはピクチャ内のビデオの時間冗長性を低減または除去するために時間的予測に依拠する。イントラモード(Iモード)は、いくつかの空間ベースコーディングモードのいずれかを指すことがある。単方向予測(Pモード)または双予測(Bモード)などのインターモードは、いくつかの時間ベースのコーディングモードのいずれかを指し得る。
[0194]図8に示すように、ビデオエンコーダ20は、符号化されるべきビデオフレーム内の現在のビデオブロックを受信する。図8の例では、ビデオエンコーダ20は、モード選択ユニット240と、(復号ピクチャバッファ(DPB)と呼ばれることもある)参照ピクチャメモリ264と、加算器250と、変換処理ユニット252と、量子化ユニット254と、エントロピー符号化ユニット256とを含む。モード選択ユニット240は、動き補償ユニット244と、動き推定ユニット242と、イントラ予測ユニット246と、分割ユニット248とを含む。ビデオブロック再構成のために、ビデオエンコーダ20はまた、逆量子化ユニット258と、逆変換ユニット260と、加算器262とを含む。いくつかの例では、デブロッキングフィルタ(図8に図示せず)も、再構成されたビデオからブロッキネスアーティファクトを除去するために、ブロック境界をフィルタ処理するために含まれる。デブロッキングフィルタは、加算器262の出力をフィルタ処理する。追加のフィルタ(ループ内またはループ後)もデブロッキングフィルタに加えて使用され得る。そのようなフィルタは、簡約のために図示されないが、必要な場合、加算器250の出力を(インループフィルタとして)フィルタ処理し得る。
[0195]符号化プロセス中に、ビデオエンコーダ20は、コーディングされるべきビデオフレームまたはスライスを受信する。フレームまたはスライスは複数のビデオブロックに分割され得る。動き推定ユニット242および動き補償ユニット244は、時間的予測を行うために、1つまたは複数の参照フレーム中の1つまたは複数のブロックに対する受信されたビデオブロックのインター予測符号化を実行する。代替的に、イントラ予測ユニット246は、空間的予測を行うために、コーディングされるべきブロックと同じフレームまたはスライス中の1つまたは複数の隣接ブロックに対する受信されたビデオブロックのイントラ予測符号化を実行し得る。ビデオエンコーダ20は、たとえば、ビデオデータのブロックごとに適切なコーディングモードを選択するために複数のコーディングパスを実行し得る。
[0196]その上、区分ユニット248は、前のコーディングパスにおける前の区分方式の評価に基づいて、ビデオデータのブロックをサブブロックに区分し得る。たとえば、区分ユニット248は、最初にフレームまたはスライスをLCUに区分し、レートひずみ分析(たとえば、レートひずみ最適化)に基づいて、LCUの各々をサブCUに区分し得る。モード選択ユニット240は、さらに、LCUのサブCUへの区分を示す4分木データ構造を生成し得る。4分木のリーフノードCUは、1つまたは複数のPUと1つまたは複数のTUとを含み得る。
[0197]モード選択ユニット240は、たとえば、誤差結果に基づいて予測モード、すなわち、イントラまたはインターのうちの1つを選択し得、残差データを生成するために、得られた予測されたブロックを加算器250に与え、参照フレームとして使用するための符号化ブロックを再構成するために、得られた予測されたブロックを加算器262に与える。モード選択ユニット240はまた、動きベクトル、イントラモードインジケータ、区分情報、および他のそのようなシンタックス情報などのシンタックス要素をエントロピー符号化ユニット256に与える。
[0198]動き推定ユニット242および動き補償ユニット244は、高度に統合され得るが、概念的な目的のために別々に示されている。動き推定ユニット242によって実行される動き推定は、動きベクトルを生成する処理であり、ビデオブロックに対する動きを推定する。動きベクトルは、たとえば、現在のフレーム内でコーディングされている現在のブロック(または、他のコード化ユニット)に対する、参照フレーム内の予測ブロック(または、他のコード化ユニット)に対する、現在のビデオフレーム内またはピクチャ内のビデオブロックのPUの変位を示し得る。予測ブロックは、絶対差の合計(SAD:sum of absolute difference)、二乗差の合計(SSD:sum of square difference)、または他の差メトリックによって決定され得るピクセル差に関する、コーディングされるブロックとよく一致することがわかったブロックである。いくつかの例では、ビデオエンコーダ20は、参照ピクチャメモリ264に記憶された参照ピクチャのサブ整数ピクセル位置の値を計算し得る。たとえば、ビデオエンコーダ20は、参照ピクチャの4分の1ピクセル位置、8分の1ピクセル位置、または他の分数ピクセル位置の値を補間し得る。したがって、動き推定ユニット242は、フルピクセル位置と分数ピクセル位置とに対して動き探索を実行し、分数ピクセル精度で動きベクトルを出力し得る。
[0199]動き推定ユニット242は、PUの位置を参照ピクチャの予測ブロックの位置と比較することによって、インターコード化スライス内のビデオブロックのPUについての動きベクトルを計算する。参照ピクチャは、第1の参照ピクチャリスト(リスト0)または第2の参照ピクチャリスト(リスト1)から選択され得、それらの各々が、参照ピクチャメモリ264に記憶された1つまたは複数の参照ピクチャを識別する。動き推定ユニット242は、エントロピー符号化ユニット256と動き補償ユニット244とに計算された動きベクトルを送る。
[0200]動き補償ユニット244によって実行される動き補償は、動き推定ユニット242によって決定された動きベクトルに基づいて予測ブロックをフェッチまたは生成することに関与し得る。この場合も、いくつかの例では、動き推定ユニット242と動き補償ユニット244とは機能的に統合され得る。現在のビデオブロックのPUのための動きベクトルを受信すると、動き補償ユニット244は、参照ピクチャリストのうちの1つにおいて動きベクトルが指す予測ブロックの位置を特定し得る。加算器250は、残差ビデオブロックを形成する。残差ビデオブロックを形成することの一部として、加算器250は、以下で説明するように、コーディングされている現在のビデオブロックのピクセル値から予測ブロックのピクセル値を減算し、ピクセル差分値を形成し得る。概して、動き推定ユニット242はルーマ成分に対して動き推定を実行し、動き補償ユニット244は、クロマ成分とルーマ成分の両方のためにルーマ成分に基づいて計算された動きベクトルを使用する。モード選択ユニット240はまた、ビデオスライスのビデオブロックを復号する際にビデオデコーダ30が使用するためのビデオブロックとビデオスライスとに関連するシンタックス要素を生成し得る。
[0201]イントラ予測ユニット246は、上記で説明したように、動き推定ユニット242と動き補償ユニット244とによって実行されるインター予測の代替として、現在のブロックをイントラ予測し得る。特に、イントラ予測ユニット246は、現在のブロックを符号化するために使用すべきイントラ予測モードを決定し得る。いくつかの例では、イントラ予測ユニット246は、たとえば、別個の符号化パス中に、様々なイントラ予測モードを使用して現在のブロックを符号化し得、イントラ予測ユニット246(または、いくつかの例では、モード選択ユニット240)は、テストされたモードから使用するのに適切なイントラ予測モードを選択し得る。
[0202]たとえば、イントラ予測ユニット246は、様々なテストされたイントラ予測モードのためのレートひずみ分析を使用してレートひずみ値を計算し、テストされたモードの中で最良のレートひずみ特性を有するイントラ予測モードを選択し得る。レートひずみ分析は、概して、符号化されたブロックと、符号化されたブロックを生成するために符号化された元の符号化されていないブロックとの間のひずみ(または誤差)の量、ならびに符号化されたブロックを生成するために使用されるビットレート(すなわち、ビット数)を決定する。イントラ予測ユニット246は、どのイントラ予測モードがブロックに関する最良のレートひずみの値を示すかを決定するために、様々な符号化ブロックに関するひずみおよびレートから比を計算し得る。
[0203]ブロックのためのイントラ予測モードを選択した後、イントラ予測ユニット246は、ブロックのための選択されたイントラ予測モードを示す情報をエントロピー符号化ユニット256に与え得る。エントロピー符号化ユニット256は、選択されたイントラ予測モードを示す情報を符号化し得る。ビデオエンコーダ20は、複数のイントラ予測モードインデックステーブルおよび複数の変更イントラ予測モードインデックステーブル(コードワードマッピングテーブルとも呼ばれる)と、様々なブロックの符号化コンテキストの定義と、コンテキストの各々について使用すべき、最確イントラ予測モード、イントラ予測モードインデックステーブル、および変更イントラ予測モードインデックステーブルの指示とを含み得る構成データを送信ビットストリーム中に含め得る。
[0204]ビデオエンコーダ20は、残差ビデオブロックを形成する。残差ビデオブロックを形成することの一部として、ビデオエンコーダ20は、コーディングされている元のビデオブロックから、モード選択ユニット240からの予測データを減算し得る。加算器250は、この減算演算を実行する1つの構成要素または複数の構成要素を表す。変換処理ユニット252は、離散コサイン変換(DCT)または概念的に同様の変換などの変換を残差ブロックに適用し、変換係数値を備えるビデオブロックを生成する。ウェーブレット変換、整数変換、サブバンド変換、DST、または他のタイプの変換が、DCTの代わりに使用され得る。いずれの場合も、変換処理ユニット252は、変換を残差ブロックに適用し、変換係数のブロックを生成する。変換は、残差情報をピクセル領域から周波数領域などの変換領域に変換し得る。
[0205]さらに、上記で説明したように、変換処理ユニット252は、非分離可能である2次変換を適用するように構成され得る。いくつかの例では、変換処理ユニット252は、量子化ユニット254が使用するための係数走査順序に従って第2の2次元係数ブロックとして非分離可能である2次変換によって形成される1次元係数ベクトルを再編成するように構成され得る。変換処理ユニット252は、得られた変換係数を量子化ユニット254に送り得る。
[0206]量子化ユニット254は、ビットレートをさらに低減するために変換係数を量子化する。量子化プロセスは、係数の一部または全部に関連付けられたビット深度を低減し得る。量子化の程度は、量子化パラメータを調整することによって修正され得る。
[0207]量子化の後に、エントロピー符号化ユニット256は、量子化変換係数を示すシンタックス要素を走査し、エントロピー符号化する。たとえば、エントロピー符号化ユニット256は、CAVLC、CABAC、SBAC、PIPEコーディングまたは別のエントロピー符号化技法を実行し得る。コンテキストベースエントロピーコーディングの場合、コンテキストは隣接ブロックに基づき得る。エントロピー符号化ユニット256によるエントロピーコーディングに続いて、符号化ビットストリームは、別のデバイス(たとえば、ビデオデコーダ30)に送信されるか、あるいは後で送信するかまたは取り出すためにアーカイブされ得る。
[0208]逆量子化ユニット258および逆変換ユニット260は、ピクセル領域において残差ブロックを再構成するために、それぞれ逆量子化および逆変換を適用する。特に、加算器262は、参照ピクチャメモリ264に記憶するための再構成されたビデオブロックを生成するために、動き補償ユニット244またはイントラ予測ユニット246によって前に生成された動き補償予測ブロックに、再構成された残差ブロックを加算する。再構成されたビデオブロックは、後続のビデオフレーム中のブロックをインターコーディングするために動き推定ユニット242および動き補償ユニット244によって参照ブロックとして使用され得る。
[0209]ビデオエンコーダ20は、概して、コード化ビデオシーケンス中の各ピクチャの各ブロックを符号化するために、上記で説明したプロセスを使用する。さらに、いくつかの例では、ビデオエンコーダ20は、ピクチャの各々を割り当てるべき時間レイヤを決定し得る。さらに、ビデオエンコーダ20は、他のレイヤ、たとえば、他のビュー、スケーラブルビデオコーディングレイヤなどのピクチャを符号化するように構成され得る。いずれの場合も、ビデオエンコーダ20は、(たとえば、様々なビデオ次元の)1つまたは複数のレイヤについて、各ピクチャが属するレイヤを示すデータをさらに符号化し得る。
[0210]図9は、本開示で説明する技法を実装し得るビデオデコーダ30の一例を示すブロック図である。本開示によれば、ビデオデコーダ30は、たとえば、2次変換に関係する技法など、本開示で説明する技法を適用するように構成され得る。図9の例では、ビデオデコーダ30は、エントロピー復号ユニット270と、動き補償ユニット272と、イントラ予測ユニット274と、逆量子化ユニット276と、逆変換ユニット278と、参照ピクチャメモリ282と、加算器280とを含む。ビデオデコーダ30は、いくつかの例では、ビデオエンコーダ20(図8)に関して説明した符号化パスとは概して逆の復号パスを実行し得る。動き補償ユニット272は、エントロピー復号ユニット270から受信された動きベクトルに基づいて予測データを生成し得、イントラ予測ユニット274は、エントロピー復号ユニット270から受信されたイントラ予測モードインジケータに基づいて予測データを生成し得る。
[0211]復号プロセス中に、ビデオデコーダ30は、符号化されたビデオスライスのビデオブロックと関連するシンタックス要素とを表す符号化されたビデオビットストリームをビデオエンコーダ20から受け取る。ビデオデコーダ30のエントロピー復号ユニット270は、量子化された係数と、動きベクトルまたはイントラ予測モードインジケータと、他のシンタックス要素とを生成するために、ビットストリームをエントロピー復号する。エントロピー復号ユニット270は、動きベクトルと他のシンタックス要素とを動き補償ユニット272に転送する。ビデオデコーダ30は、ビデオスライスレベルおよび/またはビデオブロックレベルでシンタックス要素を受信し得る。
[0212]ビデオスライスが、イントラコード化(I)スライスとしてコーディングされるとき、イントラ予測ユニット274は、現在のフレームまたはピクチャの以前に復号されたブロックから、シグナリングされたイントラ予測モードおよびデータに基づいて、現在のビデオスライスのビデオブロックのための予測データを生成し得る。ビデオフレームが、インターコード化(すなわち、B、P、または汎用PおよびBピクチャ(GPB:generalized P and B-picture))スライスとしてコーディングされるとき、動き補償ユニット272は、エントロピー復号ユニット270から受信された動きベクトルと他のシンタックス要素とに基づいて、現在のビデオスライスのビデオブロックのための予測ブロックを生成する。予測ブロックは、参照ピクチャリストの1つの中の参照ピクチャのうちの1つから生成され得る。ビデオデコーダ30は、参照ピクチャメモリ282に記憶された参照ピクチャに基づくデフォルトの構成技法を使用して参照フレームリストのリスト0およびリスト1を構成し得る。動き補償ユニット272は、動きベクトルと他のシンタックス要素とをパースすることによって現在のビデオスライスのビデオブロックのための予測情報を決定し、その予測情報を使用して、復号されている現在のビデオブロックの予測ブロックを生成する。たとえば、動き補償ユニット272は、ビデオスライスのビデオブロックをコーディングするために使用される予測モード(たとえば、イントラまたはインター予測)と、インター予測スライスタイプ(たとえば、Bスライス、Pスライス、またはGPBスライス)と、スライスのための参照ピクチャリストのうちの1つまたは複数のための構築情報と、スライスの各インター符号化ビデオブロックのための動きベクトルと、スライスの各インターコード化ビデオブロックのためのインター予測ステータスと、現在のビデオスライス中のビデオブロックを復号するための他の情報とを決定するために、受信されたシンタックス要素のうちのいくつかを使用する。
[0213]動き補償ユニット272はまた、補間フィルタに基づいて、補間を実行し得る。動き補償ユニット272は、参照ブロックのサブ整数ピクセルのための補間値を計算するために、ビデオブロックの符号化中にビデオエンコーダ20によって使用された補間フィルタを使用し得る。この場合、動き補償ユニット272は、受信されたシンタックス要素からビデオエンコーダ20によって使用された補間フィルタを決定し、予測ブロックを生成するために補間フィルタを使用し得る。
[0214]逆量子化ユニット276は、ビットストリーム中で与えられ、エントロピー復号ユニット270によって復号された、量子化変換係数を逆量子化(inverse quantize)、すなわち、逆量子化(de-quantize)する。逆量子化プロセスは、量子化の程度を決定し、同様に、適用されるべき逆量子化の程度を決定するための、ビデオスライス中のビデオブロックごとにビデオデコーダ30によって計算される量子化パラメータQPYの使用を含み得る。
[0215]逆変換ユニット278は、ピクセル領域において残差ブロックを生成するために、逆変換、たとえば、逆DCT、逆整数変換、または概念的に同様の逆変換プロセスを変換係数に適用する。さらに、本開示の様々な技法によれば、逆変換ユニット278は、非分離可能である逆2次変換を適用するように構成され得る。いくつかの例では、逆変換ユニット278は、係数走査順序に従って第2の2次元係数ブロックとして1次元係数ベクトルを再編成するように構成され得る。
[0216]動き補償ユニット272が、動きベクトルおよび他のシンタックス要素に基づいて、現在のビデオブロックについての予測ブロックを生成した後、ビデオデコーダ30は、復号ビデオブロックを形成する。復号ビデオブロックを形成することの一部として、ビデオデコーダ30は、動き補償ユニット272によって生成された対応する予測ブロックを逆変換ユニット278からの残差ブロックに加算し得る。加算器280は、この加算演算を実行する1つまたは複数の構成要素を表す。望まれる場合に、デブロッキングフィルタも、ブロッキネスアーティファクトを除去するために、復号されたブロックをフィルタ処理するために適用され得る。他のループフィルタ(コーディングループ内またはコーディングループの後のいずれであれ)も、ピクセル推移を平滑化し、または他の形でビデオ品質を改善するために、使用され得る。所与のフレームまたはピクチャの復号ビデオブロックは、次いで、参照ピクチャメモリ282に記憶され、この参照ピクチャメモリ282は後続の動き補償のために使用される参照ピクチャを記憶する。参照ピクチャメモリ282はまた、復号ビデオを、図1のディスプレイデバイス32などのディスプレイデバイス上に後で提示するために記憶する。
[0217]ビデオデコーダ30は、概して、コード化ビデオシーケンス中の各ピクチャの各ブロックを復号するために、上記で説明したプロセスを使用する。さらに、いくつかの例では、ビデオデコーダ30は、ピクチャが割り当てられる時間レイヤを示すデータを復号し得る。さらに、ビデオデコーダ30は、他のレイヤ、たとえば、他のビュー、スケーラブルビデオコーディングレイヤなどのピクチャを復号するように構成され得る。いずれの場合も、ビデオデコーダ30は、(たとえば、様々なビデオ次元の)1つまたは複数のレイヤについて、各ピクチャが属するレイヤを示すデータをさらに復号し得る。
[0218]ビデオエンコーダ20またはビデオデコーダ30によって実行され得る本開示の技法について、以下でより詳細に説明する。
[0219]図10Aは、本開示で説明する1つまたは複数の技法による、ビデオエンコーダ20による例示的な変換処理の図である。図10Aの例では、ビデオエンコーダ20の変換処理ユニット252は、1次変換ユニット802と、2次変換ユニット804と、再編成ユニット806とを備える。1次変換ユニット802は、2次元係数ブロックを生成するために残差ブロックに対して、たとえば、DSTまたはDCTなどの1次変換を適用する。2次変換ユニット804は、1次元ベクトルを生成するために、2次元係数ブロックにKLTなどの非分離可能変換を適用する。再編成ユニット806は、2次元係数ブロックとして1次元ベクトルを再編成する。量子化ユニット254は、2次元ブロックを量子化する。
[0220]図10Bは、本開示で説明する1つまたは複数の技法による、ビデオデコーダ30による例示的な変換処理の図である。図10Bの例では、ビデオデコーダ30の逆変換ユニット278は、再編成ユニット824と、2次逆変換ユニット826と、1次逆変換ユニット828とを備える。逆量子化ユニット276は、ビットストリーム中で与えられ、エントロピー復号ユニット270によって復号された量子化変換係数を逆量子化する。再編成ユニット824は、2次元係数ブロックから1次元ベクトルに変換係数を再編成する。2次逆変換ユニット826は、2次元係数ブロックを生成するために、1次元ベクトルに対してKLTなどの非分離可能逆変換を適用する。1次逆変換ユニット828は、ビデオデータのための残差係数ブロックを生成するために、2次元係数ブロックに対して分離可能逆変換を適用する。
[0221]図11は、本開示で説明する技法を実施し得るビデオデータの第1の例示的な復号を示す流れ図である。図11の例示的な技法は、ビデオデコーダ30によって実行され得る。図11の例では、デコーダ(たとえば、ビデオデコーダ30)は、第1の係数ブロックを逆量子化する(902)。デコーダは、第2の係数ブロックを生成するために逆量子化された第1の係数ブロックの少なくとも一部に第1の逆変換を適用する(904)。たとえば、第1の逆変換は、非分離可能変換である。たとえば、デコーダは、逆量子化された第1の係数ブロックに対して逆KLTを適用し得る。デコーダは、残差ビデオブロックを生成するために第2の係数ブロックに第2の逆変換を適用し得る(906)。第2の逆変換は、周波数領域からピクセル領域に第2の係数ブロックを変換する。たとえば、デコーダは、第2の係数ブロックに対して逆DCTまたはDSTを適用する。デコーダは、復号ビデオブロックを形成する(908)。復号ビデオブロックを形成することの一部として、デコーダは、1つまたは複数の予測ブロックを残差ビデオブロックに加算し得る。
[0222]図12は、本開示で説明する技法を実施し得るビデオデータの第1の例示的な符号化を示す流れ図である。説明したように、図12の例示的な技法は、エンコーダ20によって実行され得る。図12の例では、エンコーダ(たとえば、ビデオエンコーダ20)は、残差ビデオブロックを形成する(1002)。残差ビデオブロックを形成することの一部として、エンコーダは、コーディングされているビデオブロックから1つまたは複数の予測ブロックを減算し得る。エンコーダは、第1の係数ブロックを生成するために残差ビデオブロックに第1の変換を適用する(1004)。たとえば、第1の変換は、ピクセル領域から周波数領域に残差ビデオブロックを変換する。たとえば、エンコーダは、残差ビデオブロックに対してDCTまたはDSTを適用し得る。エンコーダは、第2の係数ブロックを生成するために第1の係数ブロックの少なくとも一部に第2の変換を適用する(1006)。たとえば、第2の変換は、非分離可能変換である。たとえば、エンコーダは、第2の係数ブロックに対してKLTを適用し得る。次に、エンコーダは、エントロピー符号化するための第2の係数ブロックを量子化する(1008)。
[0223]図13は、本開示で説明する技法を実施し得るビデオデータの第2の例示的な復号を示す流れ図である。説明したように、図13の例示的な技法は、ビデオデコーダ30によって実行され得る。図13の例では、デコーダ(たとえば、ビデオデコーダ30)は、係数走査順序に従って第1の1次元係数ベクトルとして第1の2次元係数ブロックを再編成する(1102)。たとえば、デコーダは、係数走査順序に従って第1の2次元係数ブロックを再編成し、ここで、より小さいインデックス値をもつ第1の2次元係数ブロック中の係数が、第1の1次元係数ベクトル中でより小さい走査インデックス位置に配置される。次に、デコーダは、第2の1次元係数ブロックを生成するために第1の1次元係数ベクトルに第1の逆変換を適用する(1104)。第1の逆変換は、非分離可能変換である。たとえば、デコーダは、1次元係数ベクトルに対して逆KLTを適用する。決定者は、係数走査順序に従って第2の2次元係数ベクトルとして第2の1次元係数ブロックを再編成する(1106)。次に、デコーダは、残差ビデオブロックを生成するために第2の2次元係数ブロックに第2の逆変換を適用する(1108)。たとえば、第2の逆変換は、周波数領域からピクセル領域に第2の2次元係数ブロックを変換する。たとえば、デコーダは、第2の2次元係数ブロックに対して逆DCTまたはDSTを適用する。デコーダは、復号ビデオブロックを形成する(1110)。復号ブロックを形成することの一部として、デコーダは、1つまたは複数の予測ブロックを残差ビデオブロックに加算し得る。
[0224]図14は、本開示で説明する技法を実施し得るビデオデータの第2の例示的な符号化を示す流れ図である。説明したように、図14の例示的な技法は、ビデオエンコーダ20によって実行され得る。図14の例では、エンコーダ(たとえば、ビデオエンコーダ20)は、残差ビデオブロックを形成する(1202)。残差ビデオブロックを形成することの一部として、エンコーダは、コーディングされているビデオブロックから1つまたは複数の予測ブロックを減算し得る。エンコーダは、第1の2次元係数ブロックを生成するために残差ビデオブロックの少なくとも一部に第1の変換を適用する(1204)。たとえば、第1の変換は、ピクセル領域から周波数領域に残差ビデオブロックを変換する。たとえば、エンコーダは、残差ビデオブロックに対してDCTまたはDSTを適用する。エンコーダは、第1の1次元係数ベクトルとして第1の2次元係数を再編成する(1206)。次に、エンコーダは、第2の1次元係数ベクトルを生成するために第1の1次元係数ブロックの少なくとも一部に第2の変換を適用する(1208)。たとえば、第2の変換は、非分離可能変換である。たとえば、エンコーダは、第1の1次元係数ブロックに対してKLTを適用する。次に、エンコーダは、係数走査順序に従って第2の2次元係数ブロックとして第2の1次元係数ベクトルを再編成する(1210)。たとえば、デコーダは、係数走査順序に従って1次元係数ベクトルを再編成し、ここで、より小さいインデックス値をもつ第2の1次元係数ベクトル中の係数が、量子化し、エントロピー符号化するための第2の2次元係数ブロック中でより小さい走査インデックス位置に配置される。
[0225]上記例に応じて、本明細書で説明した技法のいずれかのいくつかの行為またはイベントが、異なるシーケンスで実行され得、全体的に追加、マージ、または除外され得る(たとえば、すべての説明された行為またはイベントが本技法の実施のために必要であるとは限らない)ことを認識されたい。さらに、いくつかの例では、行為またはイベントは、連続的にではなく、たとえば、マルチスレッド処理、割込み処理、または複数のプロセッサを通して同時に実行され得る。
[0226]1つまたは複数の例では、説明する機能は、ハードウェア、ソフトウェア、ファームウェア、またはそれらの任意の組合せで実装され得る。ソフトウェアで実装される場合、機能は、1つまたは複数の命令またはコードとして、コンピュータ可読媒体上に記憶されるか、またはコンピュータ可読媒体を介して送信され、ハードウェアベースの処理ユニットによって実行され得る。コンピュータ可読媒体は、データ記憶媒体などの有形媒体に対応する、コンピュータ可読記憶媒体を含み得るか、または、たとえば、通信プロトコルに従って、ある場所から別の場所へのコンピュータプログラムの転送を容易にする任意の媒体を含む通信媒体を含み得る。このようにして、コンピュータ可読媒体は、概して、(1)非一時的な有形コンピュータ可読記憶媒体、あるいは(2)信号または搬送波などの通信媒体に対応し得る。データ記憶媒体は、本開示で説明した技法の実装のための命令、コードおよび/またはデータ構造を取り出すために、1つまたは複数のコンピュータあるいは1つまたは複数のプロセッサによってアクセスされ得る、任意の利用可能な媒体であり得る。コンピュータプログラム製品は、コンピュータ可読媒体を含み得る。
[0227]限定ではなく例として、そのようなコンピュータ可読記憶媒体は、RAM、ROM、EEPROM(登録商標)、CD−ROMもしくは他の光ディスクストレージ、磁気ディスクストレージ、もしくは他の磁気ストレージデバイス、フラッシュメモリ、または、命令またはデータ構造の形態の所望のプログラムコードを記憶するために使用され得、コンピュータによってアクセスされ得る任意の他の媒体を備えることができる。さらに、いかなる接続もコンピュータ可読媒体と適切に呼ばれる。たとえば、命令が、ウェブサイト、サーバ、または他のリモートソースから、同軸ケーブル、光ファイバーケーブル、ツイストペア、デジタル加入者回線(DSL)、または赤外線、無線、およびマイクロ波などのワイヤレス技術を使用して送信される場合、同軸ケーブル、光ファイバーケーブル、ツイストペア、DSL、または赤外線、無線、およびマイクロ波などのワイヤレス技術は、媒体の定義に含まれる。ただし、コンピュータ可読記憶媒体およびデータ記憶媒体は、接続、搬送波、信号、または他の一時媒体を含まないが、代わりに非一時的有形記憶媒体を対象とすることを理解されたい。本明細書で使用されるディスク(disk)およびディスク(disc)は、コンパクトディスク(disc)(CD)、レーザーディスク(登録商標)(disc)、光ディスク(disc)、デジタル多用途ディスク(disc)(DVD)、フロッピー(登録商標)ディスク(disk)およびBlu−rayディスク(disc)を含み、ここで、ディスク(disk)は通常、データを磁気的に再生し、ディスク(disc)は、データをレーザーで光学的に再生する。上記の組合せもコンピュータ可読媒体の範囲内に含めるべきである。
[0228]命令は、1つまたは複数のデジタル信号プロセッサ(DSP)、汎用マイクロプロセッサ、特定用途向け集積回路(ASIC)、フィールドプログラマブルゲートアレイ(FPGA)、あるいは他の等価な集積回路またはディスクリート論理回路など、1つまたは複数のプロセッサによって実行され得る。したがって、本明細書で使用される「プロセッサ」という用語は、上記の構造、または本明細書で説明した技法の実装に好適な任意の他の構造のいずれかを指すことがある。加えて、いくつかの態様では、本明細書で説明した機能は、符号化および復号のために構成されるか、または複合コーデックに組み込まれる、専用のハードウェアモジュールおよび/またはソフトウェアモジュール内で提供され得る。また、本技法は、1つまたは複数の回路または論理要素で十分に実装され得る。
[0229]本開示の技法は、ワイヤレスハンドセット、集積回路(IC)またはICのセット(たとえば、チップセット)を含む、多種多様なデバイスまたは装置で実装され得る。本開示では、開示される技法を実行するように構成されたデバイスの機能的態様を強調するために様々な構成要素、モジュール、またはユニットについて説明したが、それらの構成要素、モジュール、またはユニットを、必ずしも異なるハードウェアユニットによって実現する必要があるとは限らない。むしろ、上記で説明したように、様々なユニットが、好適なソフトウェアおよび/またはファームウェアとともに、上記で説明した1つまたは複数のプロセッサを含めて、コーデックハードウェアユニットにおいて組み合わされ得るか、または相互動作可能なハードウェアユニットの集合によって与えられ得る。
[0230]様々な例について説明した。これらおよび他の例は以下の特許請求の範囲内に入る。
[0230]様々な例について説明した。これらおよび他の例は以下の特許請求の範囲内に入る。
以下に本願の出願当初の特許請求の範囲に記載された発明を付記する。
[C1]
ビデオデータを復号するための方法であって、
係数走査順序に従って第1の1次元係数ベクトルとして第1の2次元係数ブロックを再編成することと、
第2の1次元係数ベクトルを生成するために前記第1の1次元係数ベクトルに第1の逆変換を適用することと、前記第1の逆変換が、非分離可能変換である、
第2の2次元係数ブロックとして前記第1の1次元係数ベクトルを再編成することと、
残差ビデオブロックを生成するために前記第2の2次元係数ブロックに第2の逆変換を適用することと、前記第2の逆変換が、周波数領域からピクセル領域に前記第2の2次元係数ブロックを変換する、
復号ビデオブロックを形成することと、ここにおいて、前記復号ビデオブロックを形成することが、1つまたは複数の予測ブロックを前記残差ビデオブロックに加算することを備える、
を備える方法。
[C2]
前記第1の2次元係数ブロックが、4×4の係数グループであり、
前記方法が、前記4×4の係数グループのための前記係数走査順序を決定することをさらに備え、
前記第1の1次元係数ベクトルとして前記第1の2次元係数ブロックを再編成することが、前記決定された係数走査順序に基づいて前記第1の1次元係数ベクトルとして前記第1の2次元係数ブロックを再編成することを備える、C1に記載の方法。
[C3]
前記第1の2次元係数ブロックが、第1の4×4の係数ブロックであり、前記第1の1次元係数ベクトルが、16×1の係数ベクトルであり、前記第2の2次元係数ブロックが第2の4×4の係数ブロックであり、前記方法が、
前記係数走査順序に従って前記第1の2次元係数ブロックを再編成すること、ここで、より小さいインデックス値をもつ前記第1の2次元係数ブロック中の係数が、前記第1の1次元係数ベクトル中でより小さい走査インデックス位置に配置される、
をさらに備える、C1に記載の方法。
[C4]
前記第1の2次元係数ブロックが、4×4の係数グループであり、
前記第1の1次元係数ベクトルとして前記第1の2次元係数ブロックを再編成することが復号情報に基づく、前記復号情報が、イントラ予測モード、コーディングユニット(CU)レベルの拡張複数変換(EMT)インデックス、変換ユニット(TU)レベルのEMTインデックス、残差4分木深度、または量子化係数のうちの1つまたは複数を備える、C1に記載の方法。
[C5]
前記第1の1次元係数ベクトルに前記第1の逆変換を適用することが、前記第2の2次元係数ブロックの非ゼロ係数の量がしきい値よりも大きくないことに基づく、C1に記載の方法。
[C6]
前記しきい値が、前記ビデオデータのブロックサイズ、イントラ予測モード、またはそれらの組合せごとに異なる、C5に記載の方法。
[C7]
前記第1の逆変換のインデックスを共有する複数の色成分の非ゼロ係数の総数の和、総絶対値和、または2乗値の和が前記しきい値よりも大きくないことに基づいて前記第1の逆変換の前記インデックスが前記ビデオデータのビットストリーム中でシグナリングされると決定することと、
前記第1の逆変換の前記インデックスを備えるブロックレベルのシンタックス要素を復号することと、ここにおいて、前記インデックスが、前記複数の色成分の各々のために使用される、
前記第1の1次元係数ベクトルに前記第1の逆変換を適用することが、前記第1の逆変換の前記インデックスに基づいて前記第1の1次元係数ベクトルに前記第1の逆変換を実行することを備える、
をさらに備える、C1に記載の方法。
[C8]
変換ユニットが変換スキップモードでコーディングされることに基づいて、前記第1の逆変換のインデックスが前記ビデオデータのビットストリーム中でシグナリングされると決定することと、
前記ビットストリームから前記第1の逆変換の前記インデックスを復号することと、 ここにおいて、前記第1の1次元係数ベクトルに前記第1の逆変換を適用することが、前記第1の逆変換の前記インデックスに基づいて前記第1の1次元係数ベクトルに前記第1の逆変換を実行することを備える、
をさらに備える、C1に記載の方法。
[C9]
M×Nの係数ブロックを複数の重複しない4×4のサブブロックに分割することと、前記複数の重複しない4×4のサブブロックが、前記第1の2次元係数ブロックを含み、MおよびNはそれぞれ、4よりも大きく、MおよびNはそれぞれ、4の倍数であり、Mは、Nに等しくない、
前記複数の重複しない4×4のサブブロックの各4×4のサブブロックに対して、複数の2次元係数ブロックを生成するために前記第1の逆変換を実行することと、前記複数の2次元係数ブロックが、前記第2の2次元係数ブロックを含む、
をさらに備える、C1に記載の方法。
[C10]
前記第1の逆変換を適用することが、2次元変換行列に前記第1の1次元係数ベクトルを乗じることを備える、C1に記載の方法。
[C11]
前記第1の2次元係数ブロックが、4×4のブロックであり、前記2次元変換行列が、ルーマイントラ予測モードとコーディングユニットレベルのインデックスとによって選択される16×16の非分離可能変換行列である、C10に記載の方法。
[C12]
前記第1の2次元係数ブロックを逆量子化すること
をさらに備える、C1に記載の方法。
[C13]
ビデオデータを符号化するための方法であって、
残差ビデオブロックを形成することと、ここにおいて、前記残差ビデオブロックを形成することが、コーディングされているビデオブロックから1つまたは複数の予測ブロックを減算することを備える、
第1の2次元係数ブロックを生成するために前記残差ビデオブロックの少なくとも一部に第1の変換を適用することと、前記第1の変換が、ピクセル領域から周波数領域に前記残差ビデオブロックを変換する、
第1の1次元係数ベクトルとして前記第1の2次元係数ブロックを再編成することと、 第2の1次元係数ベクトルを生成するために前記第1の1次元係数ベクトルの少なくとも一部に第2の変換を適用することと、前記第2の変換が、非分離可能変換である、
係数走査順序に従って第2の2次元係数ブロックとして前記第2の1次元係数ベクトルを再編成することと
を備える方法。
[C14]
前記第2の2次元係数ブロックが、4×4の係数グループであり、
前記方法が、前記4×4の係数グループのための係数走査順序を決定することをさらに備え、
前記第2の2次元係数ブロックとして前記第2の1次元係数ベクトルを再編成することが、前記決定された係数走査順序に基づいて前記第2の2次元係数ブロックとして前記第2の1次元係数ベクトルを再編成することを備える、C13に記載の方法。
[C15]
前記第1の2次元係数ブロックが、第1の4×4の係数ブロックであり、前記第2の1次元係数ベクトルが、16×1の係数ベクトルであり、前記第2の2次元係数ブロックが第2の4×4の係数ブロックであり、前記方法が、
前記係数走査順序に従って前記第2の1次元係数ベクトルを再編成すること、ここで、より小さいインデックス値をもつ前記第2の1次元係数ベクトル中の係数が、前記第2の2次元係数ブロック中でより小さい走査インデックス位置に配置される、
をさらに備える、C13に記載の方法。
[C16]
前記第2の2次元係数ブロックが、4×4の係数グループであり、
前記第2の2次元係数ブロックとして前記第2の1次元係数ベクトルを再編成することが、イントラ予測モード、コーディングユニット(CU)レベルの拡張複数変換(EMT)インデックス、変換ユニット(TU)レベルのEMTインデックス、残差4分木深度、または量子化係数のうちの1つまたは複数に基づく、C13に記載の方法。
[C17]
前記第2の2次元係数ブロックの非ゼロ係数の量がしきい値よりも大きくないかどうかを決定すること、
ここにおいて、前記第1の2次元係数ブロックの少なくとも一部に前記第2の変換を適用することが、前記第2の2次元係数ブロックの非ゼロ係数の前記量が前記しきい値よりも大きくないと決定したことに応答する、
をさらに備える、C13に記載の方法。
[C18]
前記しきい値が、前記ビデオデータのブロックサイズ、イントラ予測モード、またはそれらの組合せごとに異なる、C17に記載の方法。
[C19]
前記ビデオデータのビットストリーム中に前記第2の変換のインデックスを符号化すべきかどうかを決定すること、ここにおいて、前記第2の変換のザット前記インデックスが前記ビットストリーム中に符号化されないという決定が、前記第2の変換の前記インデックスを共有する複数の色成分の非ゼロ係数の総数の和、総絶対値和、または2乗値の和が前記しきい値よりも大きくないことに基づいて行われる、ここにおいて、
前記第2の変換の前記インデックスが、ブロックレベルでシグナリングされ、前記複数の色成分の間で共有される、
前記第1の2次元係数ブロックの少なくとも一部に前記第2の変換を適用することは、前記第2の変換の前記インデックスが前記ビットストリーム中でシグナリングされることに基づいて前記第1の2次元係数ブロックの少なくとも一部に前記第2の変換を実行することを備える、
をさらに備える、C13に記載の方法。
[C20]
変換ユニットが変換スキップモードでコーディングされていることに基づいて前記ビデオデータのビットストリーム中の前記第2の変換のインデックスを符号化すべきかどうかを決定すること、
ここにおいて、前記第1の2次元係数ブロックの少なくとも一部に前記第2の変換を適用することは、前記第2の変換の前記インデックスが前記ビットストリーム中でシグナリングされることに基づいて前記第1の2次元係数ブロックの少なくとも一部に前記第2の変換を実行することを備える、
をさらに備える、C13に記載の方法。
[C21]
M×Nの係数ブロックを複数の重複しない4×4のサブブロックに分割することと、前記複数の重複しない4×4のサブブロックが、前記第1の2次元係数ブロックを含み、MおよびNはそれぞれ、4よりも大きく、MおよびNはそれぞれ、4の倍数であり、Mは、Nに等しくない、
前記複数の重複しない4×4のサブブロックの各4×4のサブブロックに対して、複数の2次元係数ブロックを生成するために前記第2の変換を実行することと、前記複数の2次元係数ブロックが、前記第2の2次元係数ブロックを含む、
をさらに備える、C13に記載の方法。
[C22]
前記第2の変換を適用することが、2次元変換行列に前記第1の1次元係数ベクトルを乗じることを備える、C13に記載の方法。
[C23]
前記第1の2次元係数ブロックが、4×4のブロックであり、前記2次元変換行列が、ルーマイントラ予測モードとコーディングユニットレベルのインデックスとによって選択される16×16の非分離可能変換行列である、C22に記載の方法。
[C24]
前記第2の2次元係数ブロックを量子化すること
をさらに備える、C13に記載の方法。
[C25]
ビデオデータを復号するための装置であって、
前記ビデオデータを記憶するように構成されたメモリと、
係数走査順序に従って第1の1次元係数ベクトルとして第1の2次元係数ブロックを再編成することと、
第2の1次元係数ベクトルを生成するために前記第1の1次元係数ベクトルに第1の逆変換を適用することと、前記第1の逆変換が、非分離可能変換である、
第2の2次元係数ブロックとして前記第1の1次元係数ベクトルを再編成することと、
残差ビデオブロックを生成するために前記第2の2次元係数ブロックに第2の逆変換を適用することと、前記第2の逆変換が、周波数領域からピクセル領域に前記第2の2次元係数ブロックを変換する、
1つまたは複数の予測ブロックを前記残差ビデオブロックに加算することと、
1つまたは複数の予測ブロックとの前記残差ビデオブロックの前記加算に基づいて復号ビデオブロックを形成することと
を行うように構成されたビデオデコーダと
を備える装置。
[C26]
前記第1の2次元係数ブロックが、4×4の係数グループであり、前記ビデオデコーダが、
前記4×4の係数グループのための係数走査順序を決定することと、
前記決定された係数走査順序に基づいて前記第1の1次元係数ベクトルとして前記第1の2次元係数ブロックを再編成することを備える、前記第1の1次元係数ベクトルとして前記第1の2次元係数ブロックを再編成することと、
を行うようにさらに構成された、C25に記載の装置。
[C27]
前記第1の2次元係数ブロックが、第1の4×4の係数ブロックであり、前記第1の1次元係数ベクトルが、16×1の係数ベクトルであり、前記第2の2次元係数ブロックが第2の4×4の係数ブロックであり、前記ビデオデコーダが、
前記係数走査順序に従って前記第1の2次元係数ブロックを再編成すること、ここで、より小さいインデックス値をもつ前記第1の2次元係数ブロック中の係数が、前記第1の1次元係数ベクトル中でより小さい走査インデックス位置に配置される、
を行うようにさらに構成された、C25に記載の装置。
[C28]
前記第1の2次元係数ブロックが、4×4の係数グループであり、前記ビデオデコーダが、
復号情報に基づいて前記第1の1次元係数ベクトルとして前記第1の2次元係数ブロックを再編成すること、前記復号情報が、イントラ予測モード、コーディングユニット(CU)レベルの拡張複数変換(EMT)インデックス、変換ユニット(TU)レベルのEMTインデックス、残差4分木深度、または量子化係数のうちの1つまたは複数を備える、 を行うようにさらに構成された、C25に記載の装置。
[C29]
前記ビデオデコーダが、
前記第2の2次元係数ブロックの非ゼロ係数の量がしきい値よりも大きくないことに基づいて前記第1の1次元係数ベクトルに前記第1の逆変換を適用すること
を行うようにさらに構成された、C25に記載の装置。
[C30]
前記しきい値が、前記ビデオデータのブロックサイズ、イントラ予測モード、またはそれらの組合せごとに異なる、C29に記載の装置。
[C31]
前記ビデオデコーダが、
前記第1の逆変換のインデックスを共有する複数の色成分の非ゼロ係数の総数の和、総絶対値和、または2乗値の和が前記しきい値よりも大きくないことに基づいて前記第1の逆変換の前記インデックスが前記ビデオデータのビットストリーム中でシグナリングされると決定することと、
前記第1の逆変換の前記インデックスを備えるブロックレベルのシンタックス要素を復号することと、ここにおいて、前記インデックスが、前記複数の色成分の各々のために使用される、
前記第1の逆変換の前記インデックスに基づいて前記第1の1次元係数ベクトルに前記第1の逆変換を実行することを備える、前記第1の1次元係数ベクトルに前記第1の逆変換を適用することと
を行うようにさらに構成された、C25に記載の装置。
[C32]
前記ビデオデコーダが、
変換ユニットが変換スキップモードでコーディングされることに基づいて、前記第1の逆変換のインデックスが前記ビデオデータのビットストリーム中でシグナリングされると決定することと、
前記ビットストリームから前記第1の逆変換の前記インデックスを復号することと、 前記第1の逆変換の前記インデックスに基づいて前記第1の1次元係数ベクトルに前記第1の逆変換を実行することを備える、前記第1の1次元係数ベクトルに前記第1の逆変換を適用することと
を行うようにさらに構成された、C25に記載の装置。
[C33]
前記ビデオデコーダが、
M×Nの係数ブロックを複数の重複しない4×4のサブブロックに分割することと、前記複数の重複しない4×4のサブブロックが、前記第1の2次元係数ブロックを含み、MおよびNはそれぞれ、4よりも大きく、MおよびNは3それぞれ、4の倍数であり、Mは、Nに等しくない、
前記複数の重複しない4×4のサブブロックの各4×4のサブブロックに対して、複数の2次元係数ブロックを生成するために前記第1の逆変換を実行することと、前記複数の2次元係数ブロックが、前記第2の2次元係数ブロックを含む、
を行うようにさらに構成された、C25に記載の装置。
[C34]
前記第1の逆変換を適用することが、2次元変換行列に前記第1の1次元係数ベクトルを乗じることを備える、C25に記載の装置。
[C35]
前記第1の2次元係数ブロックが、4×4のブロックであり、前記2次元変換行列が、ルーマイントラ予測モードとコーディングユニットレベルのインデックスとによって選択される16×16の非分離可能変換行列である、C34に記載の装置。
[C36]
前記ビデオデコーダが、
前記第1の2次元係数ブロックを逆量子化すること
を行うようにさらに構成された、C25に記載の装置。
[C37]
前記装置が、前記復号ビデオブロックを備えるピクチャを表示するように構成されたディスプレイを備える、C25に記載の装置。
[C38]
前記装置が、カメラ、コンピュータ、モバイルデバイス、ブロードキャスト受信機デバイス、またはセットトップボックスのうちの1つまたは複数を備える、C25に記載の装置。
[C39]
ビデオデータを符号化するための装置であって、
前記ビデオデータを記憶するように構成されたメモリと、
残差ビデオブロックを形成することと、ここにおいて、前記残差ビデオブロックを形成することが、コーディングされているビデオブロックから1つまたは複数の予測ブロックを減算することを備える、
第1の2次元係数ブロックを生成するために前記残差ビデオブロックの少なくとも一部に第1の変換を適用することと、前記第1の変換が、ピクセル領域から周波数領域に前記残差ビデオブロックを変換する、
第1の1次元係数ベクトルを生成するために前記第1の2次元係数ブロックを再編成することと、
第2の1次元係数ベクトルを生成するために前記第1の1次元係数ベクトルの少なくとも一部に第2の変換を適用することと、前記第2の変換が、非分離可能変換である、 係数走査順序に従って第2の2次元係数ブロックとして前記第2の1次元係数ベクトルを再編成することと
を行うように構成されたビデオエンコーダと
を備える装置。
[C40]
前記第2の2次元係数ブロックが、4×4の係数グループであり、前記ビデオエンコーダが、
前記4×4の係数グループのための係数走査順序を決定することと、
前記決定された係数走査順序に基づいて前記第2の2次元係数ブロックとして前記第2の1次元係数ベクトルを再編成することを備える、前記第2の2次元係数ブロックとして前記第2の1次元係数ベクトルを再編成することと
を行うようにさらに構成された、C39に記載の装置。
[C41]
前記第1の2次元係数ブロックが、第1の4×4の係数ブロックであり、前記第2の1次元係数ベクトルが、16×1の係数ベクトルであり、前記第2の2次元係数ブロックが第2の4×4の係数ブロックであり、前記ビデオデコーダが、
前記係数走査順序に従って前記第2の1次元係数ベクトルを再編成すること、ここで、より小さいインデックス値をもつ前記第2の1次元係数ベクトル中の係数が、前記第2の2次元係数ブロック中でより小さい走査インデックス位置に配置される、
を行うようにさらに構成された、C39に記載の装置。
[C42]
前記第2の2次元係数ブロックが、4×4の係数グループであり、
前記ビデオエンコーダが、イントラ予測モード、コーディングユニット(CU)レベルの拡張複数変換(EMT)インデックス、変換ユニット(TU)レベルのEMTインデックス、残差4分木深度、または量子化係数のうちの1つまたは複数に基づいて前記第2の2次元係数ブロックとして前記第2の1次元係数ベクトルを再編成することを行うようにさらに構成された、C39に記載の装置。
[C43]
前記ビデオエンコーダが、
前記第2の2次元係数ブロックの非ゼロ係数の量がしきい値よりも大きくないかどうかを決定することと、
前記第2の2次元係数ブロックの非ゼロ係数の前記量が前記しきい値よりも大きくないと決定したことに応答して、前記第1の2次元係数ブロックの少なくとも一部に前記第2の変換を適用することと
を行うようにさらに構成された、C39に記載の装置。
[C44]
前記しきい値が、前記ビデオデータのブロックサイズ、イントラ予測モード、またはそれらの組合せごとに異なる、C43に記載の装置。
[C45]
前記ビデオエンコーダが、
前記ビデオデータのビットストリーム中に前記第2の変換のインデックスを符号化すべきかどうかを決定することと、ここにおいて、前記第2の変換のザット前記インデックスが前記ビットストリーム中に符号化されないという決定が、前記第2の変換の前記インデックスを共有する複数の色成分の非ゼロ係数の総数の和、総絶対値和、または2乗値の和が前記しきい値よりも大きくないことに基づいて行われる、ここにおいて、前記第2の変換の前記インデックスが、ブロックレベルでシグナリングされ、前記複数の色成分の間で共有される、
前記第2の変換の前記インデックスが前記ビットストリーム中でシグナリングされることに基づいて前記第1の2次元係数ブロックの少なくとも一部に前記第2の変換を実行することを備える、前記第1の2次元係数ブロックの少なくとも一部に前記第2の変換を適用することと
を行うようにさらに構成された、C39に記載の装置。
[C46]
前記ビデオエンコーダが、
変換ユニットが変換スキップモードでコーディングされていることに基づいて前記ビデオデータのビットストリーム中の前記第2の変換のインデックスを符号化すべきかどうかを決定することと、
前記第2の変換の前記インデックスが前記ビットストリーム中でシグナリングされることに基づいて前記第1の2次元係数ブロックの少なくとも一部に前記第2の変換を実行することを備える、前記第1の2次元係数ブロックの少なくとも一部に前記第2の変換を適用することと
を行うようにさらに構成された、C39に記載の装置。
[C47]
前記ビデオエンコーダが、
M×Nの係数ブロックを複数の重複しない4×4のサブブロックに分割することと、前記複数の重複しない4×4のサブブロックが、前記第1の2次元係数ブロックを含み、MおよびNはそれぞれ、4よりも大きく、MおよびNはそれぞれ、4の倍数であり、Mは、Nに等しくない、
前記複数の重複しない4×4のサブブロックの各4×4のサブブロックに対して、複数の2次元係数ブロックを生成するために前記第2の変換を実行することと、前記複数の2次元係数ブロックが、前記第2の2次元係数ブロックを含む、
を行うようにさらに構成された、C39に記載の装置。
[C48]
前記第2の変換を適用することが、2次元変換行列に前記第1の1次元係数ベクトルを乗じることを備える、C39に記載の装置。
[C49]
前記第1の2次元係数ブロックが、4×4のブロックであり、前記2次元変換行列が、ルーマイントラ予測モードとコーディングユニットレベルのインデックスとによって選択される16×16の非分離可能変換行列である、C48に記載の装置。
[C50]
前記ビデオエンコーダが、
前記第2の2次元係数ブロックを量子化すること
を行うようにさらに構成された、C39に記載の装置。
[C51]
前記装置が、前記ビデオブロックを備えるピクチャをキャプチャするように構成されたカメラを備える、C39に記載の装置。
[C52]
前記装置が、カメラ、コンピュータ、モバイルデバイス、ブロードキャスト受信機デバイス、またはセットトップボックスのうちの1つまたは複数を備える、C39に記載の装置。
[C53]
ビデオデータを復号するための装置であって、
係数走査順序に従って第1の1次元係数ベクトルとして第1の2次元係数ブロックを再編成するための手段と、
第2の1次元係数ベクトルを生成するために前記第1の1次元係数ベクトルに第1の逆変換を適用するための手段と、前記第1の逆変換が、非分離可能変換である、
第2の2次元係数ブロックとして前記第1の1次元係数ベクトルを再編成するための手段と、
残差ビデオブロックを生成するために前記第2の2次元係数ブロックに第2の逆変換を適用するための手段と、前記第2の逆変換が、周波数領域からピクセル領域に前記第2の2次元係数ブロックを変換する、
復号ビデオブロックを形成するための手段と、ここにおいて、前記復号ビデオブロックを形成するための前記手段が、1つまたは複数の予測ブロックを前記残差ビデオブロックに加算するための手段を備える、
を備える装置。
[C54]
ビデオデータを符号化するための装置であって、
残差ビデオブロックを形成するための手段と、ここにおいて、前記残差ビデオブロックを形成することが、コーディングされているビデオブロックから1つまたは複数の予測ブロックを減算することを備える、
第1の2次元係数ブロックを生成するために前記残差ビデオブロックの少なくとも一部に第1の変換を適用するための手段と、前記第1の変換が、ピクセル領域から周波数領域に前記残差ビデオブロックを変換する、
第1の1次元係数ベクトルを生成するために前記第1の2次元係数ブロックを再編成するための手段と、
第2の1次元係数ベクトルを生成するために前記第1の1次元係数ベクトルの少なくとも一部に第2の変換を適用するための手段と、前記第2の変換が、非分離可能変換である、
係数走査順序に従って第2の2次元係数ブロックとして前記第2の1次元係数ベクトルを再編成するための手段と
を備える装置。
[C55]
実行されたとき、ビデオデータを復号するためのデバイスの1つまたは複数のプロセッサに、
係数走査順序に従って第1の1次元係数ベクトルとして第1の2次元係数ブロックを再編成することと、
第2の1次元係数ベクトルを生成するために前記第1の1次元係数ベクトルに第1の逆変換を適用することと、前記第1の逆変換が、非分離可能変換である、
第2の2次元係数ブロックとして前記第1の1次元係数ベクトルを再編成することと、 残差ビデオブロックを生成するために前記第2の2次元係数ブロックに第2の逆変換を適用することと、前記第2の逆変換が、周波数領域からピクセル領域に前記第2の2次元係数ブロックを変換する、
復号ビデオブロックを形成することと、ここにおいて、前記復号ビデオブロックを形成することが、1つまたは複数の予測ブロックを前記残差ビデオブロックに加算することを備える、
を行わせる命令を記憶した非一時的コンピュータ可読記憶媒体。

Claims (55)

  1. ビデオデータを復号するための方法であって、
    係数走査順序に従って第1の1次元係数ベクトルとして第1の2次元係数ブロックを再編成することと、
    第2の1次元係数ベクトルを生成するために前記第1の1次元係数ベクトルに第1の逆変換を適用することと、前記第1の逆変換が、非分離可能変換である、
    第2の2次元係数ブロックとして前記第1の1次元係数ベクトルを再編成することと、
    残差ビデオブロックを生成するために前記第2の2次元係数ブロックに第2の逆変換を適用することと、前記第2の逆変換が、周波数領域からピクセル領域に前記第2の2次元係数ブロックを変換する、
    復号ビデオブロックを形成することと、ここにおいて、前記復号ビデオブロックを形成することが、1つまたは複数の予測ブロックを前記残差ビデオブロックに加算することを備える、
    を備える方法。
  2. 前記第1の2次元係数ブロックが、4×4の係数グループであり、
    前記方法が、前記4×4の係数グループのための前記係数走査順序を決定することをさらに備え、
    前記第1の1次元係数ベクトルとして前記第1の2次元係数ブロックを再編成することが、前記決定された係数走査順序に基づいて前記第1の1次元係数ベクトルとして前記第1の2次元係数ブロックを再編成することを備える、請求項1に記載の方法。
  3. 前記第1の2次元係数ブロックが、第1の4×4の係数ブロックであり、前記第1の1次元係数ベクトルが、16×1の係数ベクトルであり、前記第2の2次元係数ブロックが第2の4×4の係数ブロックであり、前記方法が、
    前記係数走査順序に従って前記第1の2次元係数ブロックを再編成すること、ここで、より小さいインデックス値をもつ前記第1の2次元係数ブロック中の係数が、前記第1の1次元係数ベクトル中でより小さい走査インデックス位置に配置される、
    をさらに備える、請求項1に記載の方法。
  4. 前記第1の2次元係数ブロックが、4×4の係数グループであり、
    前記第1の1次元係数ベクトルとして前記第1の2次元係数ブロックを再編成することが復号情報に基づく、前記復号情報が、イントラ予測モード、コーディングユニット(CU)レベルの拡張複数変換(EMT)インデックス、変換ユニット(TU)レベルのEMTインデックス、残差4分木深度、または量子化係数のうちの1つまたは複数を備える、請求項1に記載の方法。
  5. 前記第1の1次元係数ベクトルに前記第1の逆変換を適用することが、前記第2の2次元係数ブロックの非ゼロ係数の量がしきい値よりも大きくないことに基づく、請求項1に記載の方法。
  6. 前記しきい値が、前記ビデオデータのブロックサイズ、イントラ予測モード、またはそれらの組合せごとに異なる、請求項5に記載の方法。
  7. 前記第1の逆変換のインデックスを共有する複数の色成分の非ゼロ係数の総数の和、総絶対値和、または2乗値の和が前記しきい値よりも大きくないことに基づいて前記第1の逆変換の前記インデックスが前記ビデオデータのビットストリーム中でシグナリングされると決定することと、
    前記第1の逆変換の前記インデックスを備えるブロックレベルのシンタックス要素を復号することと、ここにおいて、前記インデックスが、前記複数の色成分の各々のために使用される、
    前記第1の1次元係数ベクトルに前記第1の逆変換を適用することが、前記第1の逆変換の前記インデックスに基づいて前記第1の1次元係数ベクトルに前記第1の逆変換を実行することを備える、
    をさらに備える、請求項1に記載の方法。
  8. 変換ユニットが変換スキップモードでコーディングされることに基づいて、前記第1の逆変換のインデックスが前記ビデオデータのビットストリーム中でシグナリングされると決定することと、
    前記ビットストリームから前記第1の逆変換の前記インデックスを復号することと、
    ここにおいて、前記第1の1次元係数ベクトルに前記第1の逆変換を適用することが、前記第1の逆変換の前記インデックスに基づいて前記第1の1次元係数ベクトルに前記第1の逆変換を実行することを備える、
    をさらに備える、請求項1に記載の方法。
  9. M×Nの係数ブロックを複数の重複しない4×4のサブブロックに分割することと、前記複数の重複しない4×4のサブブロックが、前記第1の2次元係数ブロックを含み、MおよびNはそれぞれ、4よりも大きく、MおよびNはそれぞれ、4の倍数であり、Mは、Nに等しくない、
    前記複数の重複しない4×4のサブブロックの各4×4のサブブロックに対して、複数の2次元係数ブロックを生成するために前記第1の逆変換を実行することと、前記複数の2次元係数ブロックが、前記第2の2次元係数ブロックを含む、
    をさらに備える、請求項1に記載の方法。
  10. 前記第1の逆変換を適用することが、2次元変換行列に前記第1の1次元係数ベクトルを乗じることを備える、請求項1に記載の方法。
  11. 前記第1の2次元係数ブロックが、4×4のブロックであり、前記2次元変換行列が、ルーマイントラ予測モードとコーディングユニットレベルのインデックスとによって選択される16×16の非分離可能変換行列である、請求項10に記載の方法。
  12. 前記第1の2次元係数ブロックを逆量子化すること
    をさらに備える、請求項1に記載の方法。
  13. ビデオデータを符号化するための方法であって、
    残差ビデオブロックを形成することと、ここにおいて、前記残差ビデオブロックを形成することが、コーディングされているビデオブロックから1つまたは複数の予測ブロックを減算することを備える、
    第1の2次元係数ブロックを生成するために前記残差ビデオブロックの少なくとも一部に第1の変換を適用することと、前記第1の変換が、ピクセル領域から周波数領域に前記残差ビデオブロックを変換する、
    第1の1次元係数ベクトルとして前記第1の2次元係数ブロックを再編成することと、
    第2の1次元係数ベクトルを生成するために前記第1の1次元係数ベクトルの少なくとも一部に第2の変換を適用することと、前記第2の変換が、非分離可能変換である、
    係数走査順序に従って第2の2次元係数ブロックとして前記第2の1次元係数ベクトルを再編成することと
    を備える方法。
  14. 前記第2の2次元係数ブロックが、4×4の係数グループであり、
    前記方法が、前記4×4の係数グループのための係数走査順序を決定することをさらに備え、
    前記第2の2次元係数ブロックとして前記第2の1次元係数ベクトルを再編成することが、前記決定された係数走査順序に基づいて前記第2の2次元係数ブロックとして前記第2の1次元係数ベクトルを再編成することを備える、請求項13に記載の方法。
  15. 前記第1の2次元係数ブロックが、第1の4×4の係数ブロックであり、前記第2の1次元係数ベクトルが、16×1の係数ベクトルであり、前記第2の2次元係数ブロックが第2の4×4の係数ブロックであり、前記方法が、
    前記係数走査順序に従って前記第2の1次元係数ベクトルを再編成すること、ここで、より小さいインデックス値をもつ前記第2の1次元係数ベクトル中の係数が、前記第2の2次元係数ブロック中でより小さい走査インデックス位置に配置される、
    をさらに備える、請求項13に記載の方法。
  16. 前記第2の2次元係数ブロックが、4×4の係数グループであり、
    前記第2の2次元係数ブロックとして前記第2の1次元係数ベクトルを再編成することが、イントラ予測モード、コーディングユニット(CU)レベルの拡張複数変換(EMT)インデックス、変換ユニット(TU)レベルのEMTインデックス、残差4分木深度、または量子化係数のうちの1つまたは複数に基づく、請求項13に記載の方法。
  17. 前記第2の2次元係数ブロックの非ゼロ係数の量がしきい値よりも大きくないかどうかを決定すること、
    ここにおいて、前記第1の2次元係数ブロックの少なくとも一部に前記第2の変換を適用することが、前記第2の2次元係数ブロックの非ゼロ係数の前記量が前記しきい値よりも大きくないと決定したことに応答する、
    をさらに備える、請求項13に記載の方法。
  18. 前記しきい値が、前記ビデオデータのブロックサイズ、イントラ予測モード、またはそれらの組合せごとに異なる、請求項17に記載の方法。
  19. 前記ビデオデータのビットストリーム中に前記第2の変換のインデックスを符号化すべきかどうかを決定すること、ここにおいて、前記第2の変換のザット前記インデックスが前記ビットストリーム中に符号化されないという決定が、前記第2の変換の前記インデックスを共有する複数の色成分の非ゼロ係数の総数の和、総絶対値和、または2乗値の和が前記しきい値よりも大きくないことに基づいて行われる、ここにおいて、
    前記第2の変換の前記インデックスが、ブロックレベルでシグナリングされ、前記複数の色成分の間で共有される、
    前記第1の2次元係数ブロックの少なくとも一部に前記第2の変換を適用することは、前記第2の変換の前記インデックスが前記ビットストリーム中でシグナリングされることに基づいて前記第1の2次元係数ブロックの少なくとも一部に前記第2の変換を実行することを備える、
    をさらに備える、請求項13に記載の方法。
  20. 変換ユニットが変換スキップモードでコーディングされていることに基づいて前記ビデオデータのビットストリーム中の前記第2の変換のインデックスを符号化すべきかどうかを決定すること、
    ここにおいて、前記第1の2次元係数ブロックの少なくとも一部に前記第2の変換を適用することは、前記第2の変換の前記インデックスが前記ビットストリーム中でシグナリングされることに基づいて前記第1の2次元係数ブロックの少なくとも一部に前記第2の変換を実行することを備える、
    をさらに備える、請求項13に記載の方法。
  21. M×Nの係数ブロックを複数の重複しない4×4のサブブロックに分割することと、前記複数の重複しない4×4のサブブロックが、前記第1の2次元係数ブロックを含み、MおよびNはそれぞれ、4よりも大きく、MおよびNはそれぞれ、4の倍数であり、Mは、Nに等しくない、
    前記複数の重複しない4×4のサブブロックの各4×4のサブブロックに対して、複数の2次元係数ブロックを生成するために前記第2の変換を実行することと、前記複数の2次元係数ブロックが、前記第2の2次元係数ブロックを含む、
    をさらに備える、請求項13に記載の方法。
  22. 前記第2の変換を適用することが、2次元変換行列に前記第1の1次元係数ベクトルを乗じることを備える、請求項13に記載の方法。
  23. 前記第1の2次元係数ブロックが、4×4のブロックであり、前記2次元変換行列が、ルーマイントラ予測モードとコーディングユニットレベルのインデックスとによって選択される16×16の非分離可能変換行列である、請求項22に記載の方法。
  24. 前記第2の2次元係数ブロックを量子化すること
    をさらに備える、請求項13に記載の方法。
  25. ビデオデータを復号するための装置であって、
    前記ビデオデータを記憶するように構成されたメモリと、
    係数走査順序に従って第1の1次元係数ベクトルとして第1の2次元係数ブロックを再編成することと、
    第2の1次元係数ベクトルを生成するために前記第1の1次元係数ベクトルに第1の逆変換を適用することと、前記第1の逆変換が、非分離可能変換である、
    第2の2次元係数ブロックとして前記第1の1次元係数ベクトルを再編成することと、
    残差ビデオブロックを生成するために前記第2の2次元係数ブロックに第2の逆変換を適用することと、前記第2の逆変換が、周波数領域からピクセル領域に前記第2の2次元係数ブロックを変換する、
    1つまたは複数の予測ブロックを前記残差ビデオブロックに加算することと、
    1つまたは複数の予測ブロックとの前記残差ビデオブロックの前記加算に基づいて復号ビデオブロックを形成することと
    を行うように構成されたビデオデコーダと
    を備える装置。
  26. 前記第1の2次元係数ブロックが、4×4の係数グループであり、前記ビデオデコーダが、
    前記4×4の係数グループのための係数走査順序を決定することと、
    前記決定された係数走査順序に基づいて前記第1の1次元係数ベクトルとして前記第1の2次元係数ブロックを再編成することを備える、前記第1の1次元係数ベクトルとして前記第1の2次元係数ブロックを再編成することと、
    を行うようにさらに構成された、請求項25に記載の装置。
  27. 前記第1の2次元係数ブロックが、第1の4×4の係数ブロックであり、前記第1の1次元係数ベクトルが、16×1の係数ベクトルであり、前記第2の2次元係数ブロックが第2の4×4の係数ブロックであり、前記ビデオデコーダが、
    前記係数走査順序に従って前記第1の2次元係数ブロックを再編成すること、ここで、より小さいインデックス値をもつ前記第1の2次元係数ブロック中の係数が、前記第1の1次元係数ベクトル中でより小さい走査インデックス位置に配置される、
    を行うようにさらに構成された、請求項25に記載の装置。
  28. 前記第1の2次元係数ブロックが、4×4の係数グループであり、前記ビデオデコーダが、
    復号情報に基づいて前記第1の1次元係数ベクトルとして前記第1の2次元係数ブロックを再編成すること、前記復号情報が、イントラ予測モード、コーディングユニット(CU)レベルの拡張複数変換(EMT)インデックス、変換ユニット(TU)レベルのEMTインデックス、残差4分木深度、または量子化係数のうちの1つまたは複数を備える、
    を行うようにさらに構成された、請求項25に記載の装置。
  29. 前記ビデオデコーダが、
    前記第2の2次元係数ブロックの非ゼロ係数の量がしきい値よりも大きくないことに基づいて前記第1の1次元係数ベクトルに前記第1の逆変換を適用すること
    を行うようにさらに構成された、請求項25に記載の装置。
  30. 前記しきい値が、前記ビデオデータのブロックサイズ、イントラ予測モード、またはそれらの組合せごとに異なる、請求項29に記載の装置。
  31. 前記ビデオデコーダが、
    前記第1の逆変換のインデックスを共有する複数の色成分の非ゼロ係数の総数の和、総絶対値和、または2乗値の和が前記しきい値よりも大きくないことに基づいて前記第1の逆変換の前記インデックスが前記ビデオデータのビットストリーム中でシグナリングされると決定することと、
    前記第1の逆変換の前記インデックスを備えるブロックレベルのシンタックス要素を復号することと、ここにおいて、前記インデックスが、前記複数の色成分の各々のために使用される、
    前記第1の逆変換の前記インデックスに基づいて前記第1の1次元係数ベクトルに前記第1の逆変換を実行することを備える、前記第1の1次元係数ベクトルに前記第1の逆変換を適用することと
    を行うようにさらに構成された、請求項25に記載の装置。
  32. 前記ビデオデコーダが、
    変換ユニットが変換スキップモードでコーディングされることに基づいて、前記第1の逆変換のインデックスが前記ビデオデータのビットストリーム中でシグナリングされると決定することと、
    前記ビットストリームから前記第1の逆変換の前記インデックスを復号することと、
    前記第1の逆変換の前記インデックスに基づいて前記第1の1次元係数ベクトルに前記第1の逆変換を実行することを備える、前記第1の1次元係数ベクトルに前記第1の逆変換を適用することと
    を行うようにさらに構成された、請求項25に記載の装置。
  33. 前記ビデオデコーダが、
    M×Nの係数ブロックを複数の重複しない4×4のサブブロックに分割することと、前記複数の重複しない4×4のサブブロックが、前記第1の2次元係数ブロックを含み、MおよびNはそれぞれ、4よりも大きく、MおよびNは3それぞれ、4の倍数であり、Mは、Nに等しくない、
    前記複数の重複しない4×4のサブブロックの各4×4のサブブロックに対して、複数の2次元係数ブロックを生成するために前記第1の逆変換を実行することと、前記複数の2次元係数ブロックが、前記第2の2次元係数ブロックを含む、
    を行うようにさらに構成された、請求項25に記載の装置。
  34. 前記第1の逆変換を適用することが、2次元変換行列に前記第1の1次元係数ベクトルを乗じることを備える、請求項25に記載の装置。
  35. 前記第1の2次元係数ブロックが、4×4のブロックであり、前記2次元変換行列が、ルーマイントラ予測モードとコーディングユニットレベルのインデックスとによって選択される16×16の非分離可能変換行列である、請求項34に記載の装置。
  36. 前記ビデオデコーダが、
    前記第1の2次元係数ブロックを逆量子化すること
    を行うようにさらに構成された、請求項25に記載の装置。
  37. 前記装置が、前記復号ビデオブロックを備えるピクチャを表示するように構成されたディスプレイを備える、請求項25に記載の装置。
  38. 前記装置が、カメラ、コンピュータ、モバイルデバイス、ブロードキャスト受信機デバイス、またはセットトップボックスのうちの1つまたは複数を備える、請求項25に記載の装置。
  39. ビデオデータを符号化するための装置であって、
    前記ビデオデータを記憶するように構成されたメモリと、
    残差ビデオブロックを形成することと、ここにおいて、前記残差ビデオブロックを形成することが、コーディングされているビデオブロックから1つまたは複数の予測ブロックを減算することを備える、
    第1の2次元係数ブロックを生成するために前記残差ビデオブロックの少なくとも一部に第1の変換を適用することと、前記第1の変換が、ピクセル領域から周波数領域に前記残差ビデオブロックを変換する、
    第1の1次元係数ベクトルを生成するために前記第1の2次元係数ブロックを再編成することと、
    第2の1次元係数ベクトルを生成するために前記第1の1次元係数ベクトルの少なくとも一部に第2の変換を適用することと、前記第2の変換が、非分離可能変換である、
    係数走査順序に従って第2の2次元係数ブロックとして前記第2の1次元係数ベクトルを再編成することと
    を行うように構成されたビデオエンコーダと
    を備える装置。
  40. 前記第2の2次元係数ブロックが、4×4の係数グループであり、前記ビデオエンコーダが、
    前記4×4の係数グループのための係数走査順序を決定することと、
    前記決定された係数走査順序に基づいて前記第2の2次元係数ブロックとして前記第2の1次元係数ベクトルを再編成することを備える、前記第2の2次元係数ブロックとして前記第2の1次元係数ベクトルを再編成することと
    を行うようにさらに構成された、請求項39に記載の装置。
  41. 前記第1の2次元係数ブロックが、第1の4×4の係数ブロックであり、前記第2の1次元係数ベクトルが、16×1の係数ベクトルであり、前記第2の2次元係数ブロックが第2の4×4の係数ブロックであり、前記ビデオデコーダが、
    前記係数走査順序に従って前記第2の1次元係数ベクトルを再編成すること、ここで、より小さいインデックス値をもつ前記第2の1次元係数ベクトル中の係数が、前記第2の2次元係数ブロック中でより小さい走査インデックス位置に配置される、
    を行うようにさらに構成された、請求項39に記載の装置。
  42. 前記第2の2次元係数ブロックが、4×4の係数グループであり、
    前記ビデオエンコーダが、イントラ予測モード、コーディングユニット(CU)レベルの拡張複数変換(EMT)インデックス、変換ユニット(TU)レベルのEMTインデックス、残差4分木深度、または量子化係数のうちの1つまたは複数に基づいて前記第2の2次元係数ブロックとして前記第2の1次元係数ベクトルを再編成することを行うようにさらに構成された、請求項39に記載の装置。
  43. 前記ビデオエンコーダが、
    前記第2の2次元係数ブロックの非ゼロ係数の量がしきい値よりも大きくないかどうかを決定することと、
    前記第2の2次元係数ブロックの非ゼロ係数の前記量が前記しきい値よりも大きくないと決定したことに応答して、前記第1の2次元係数ブロックの少なくとも一部に前記第2の変換を適用することと
    を行うようにさらに構成された、請求項39に記載の装置。
  44. 前記しきい値が、前記ビデオデータのブロックサイズ、イントラ予測モード、またはそれらの組合せごとに異なる、請求項43に記載の装置。
  45. 前記ビデオエンコーダが、
    前記ビデオデータのビットストリーム中に前記第2の変換のインデックスを符号化すべきかどうかを決定することと、ここにおいて、前記第2の変換のザット前記インデックスが前記ビットストリーム中に符号化されないという決定が、前記第2の変換の前記インデックスを共有する複数の色成分の非ゼロ係数の総数の和、総絶対値和、または2乗値の和が前記しきい値よりも大きくないことに基づいて行われる、ここにおいて、前記第2の変換の前記インデックスが、ブロックレベルでシグナリングされ、前記複数の色成分の間で共有される、
    前記第2の変換の前記インデックスが前記ビットストリーム中でシグナリングされることに基づいて前記第1の2次元係数ブロックの少なくとも一部に前記第2の変換を実行することを備える、前記第1の2次元係数ブロックの少なくとも一部に前記第2の変換を適用することと
    を行うようにさらに構成された、請求項39に記載の装置。
  46. 前記ビデオエンコーダが、
    変換ユニットが変換スキップモードでコーディングされていることに基づいて前記ビデオデータのビットストリーム中の前記第2の変換のインデックスを符号化すべきかどうかを決定することと、
    前記第2の変換の前記インデックスが前記ビットストリーム中でシグナリングされることに基づいて前記第1の2次元係数ブロックの少なくとも一部に前記第2の変換を実行することを備える、前記第1の2次元係数ブロックの少なくとも一部に前記第2の変換を適用することと
    を行うようにさらに構成された、請求項39に記載の装置。
  47. 前記ビデオエンコーダが、
    M×Nの係数ブロックを複数の重複しない4×4のサブブロックに分割することと、前記複数の重複しない4×4のサブブロックが、前記第1の2次元係数ブロックを含み、MおよびNはそれぞれ、4よりも大きく、MおよびNはそれぞれ、4の倍数であり、Mは、Nに等しくない、
    前記複数の重複しない4×4のサブブロックの各4×4のサブブロックに対して、複数の2次元係数ブロックを生成するために前記第2の変換を実行することと、前記複数の2次元係数ブロックが、前記第2の2次元係数ブロックを含む、
    を行うようにさらに構成された、請求項39に記載の装置。
  48. 前記第2の変換を適用することが、2次元変換行列に前記第1の1次元係数ベクトルを乗じることを備える、請求項39に記載の装置。
  49. 前記第1の2次元係数ブロックが、4×4のブロックであり、前記2次元変換行列が、ルーマイントラ予測モードとコーディングユニットレベルのインデックスとによって選択される16×16の非分離可能変換行列である、請求項48に記載の装置。
  50. 前記ビデオエンコーダが、
    前記第2の2次元係数ブロックを量子化すること
    を行うようにさらに構成された、請求項39に記載の装置。
  51. 前記装置が、前記ビデオブロックを備えるピクチャをキャプチャするように構成されたカメラを備える、請求項39に記載の装置。
  52. 前記装置が、カメラ、コンピュータ、モバイルデバイス、ブロードキャスト受信機デバイス、またはセットトップボックスのうちの1つまたは複数を備える、請求項39に記載の装置。
  53. ビデオデータを復号するための装置であって、
    係数走査順序に従って第1の1次元係数ベクトルとして第1の2次元係数ブロックを再編成するための手段と、
    第2の1次元係数ベクトルを生成するために前記第1の1次元係数ベクトルに第1の逆変換を適用するための手段と、前記第1の逆変換が、非分離可能変換である、
    第2の2次元係数ブロックとして前記第1の1次元係数ベクトルを再編成するための手段と、
    残差ビデオブロックを生成するために前記第2の2次元係数ブロックに第2の逆変換を適用するための手段と、前記第2の逆変換が、周波数領域からピクセル領域に前記第2の2次元係数ブロックを変換する、
    復号ビデオブロックを形成するための手段と、ここにおいて、前記復号ビデオブロックを形成するための前記手段が、1つまたは複数の予測ブロックを前記残差ビデオブロックに加算するための手段を備える、
    を備える装置。
  54. ビデオデータを符号化するための装置であって、
    残差ビデオブロックを形成するための手段と、ここにおいて、前記残差ビデオブロックを形成することが、コーディングされているビデオブロックから1つまたは複数の予測ブロックを減算することを備える、
    第1の2次元係数ブロックを生成するために前記残差ビデオブロックの少なくとも一部に第1の変換を適用するための手段と、前記第1の変換が、ピクセル領域から周波数領域に前記残差ビデオブロックを変換する、
    第1の1次元係数ベクトルを生成するために前記第1の2次元係数ブロックを再編成するための手段と、
    第2の1次元係数ベクトルを生成するために前記第1の1次元係数ベクトルの少なくとも一部に第2の変換を適用するための手段と、前記第2の変換が、非分離可能変換である、
    係数走査順序に従って第2の2次元係数ブロックとして前記第2の1次元係数ベクトルを再編成するための手段と
    を備える装置。
  55. 実行されたとき、ビデオデータを復号するためのデバイスの1つまたは複数のプロセッサに、
    係数走査順序に従って第1の1次元係数ベクトルとして第1の2次元係数ブロックを再編成することと、
    第2の1次元係数ベクトルを生成するために前記第1の1次元係数ベクトルに第1の逆変換を適用することと、前記第1の逆変換が、非分離可能変換である、
    第2の2次元係数ブロックとして前記第1の1次元係数ベクトルを再編成することと、
    残差ビデオブロックを生成するために前記第2の2次元係数ブロックに第2の逆変換を適用することと、前記第2の逆変換が、周波数領域からピクセル領域に前記第2の2次元係数ブロックを変換する、
    復号ビデオブロックを形成することと、ここにおいて、前記復号ビデオブロックを形成することが、1つまたは複数の予測ブロックを前記残差ビデオブロックに加算することを備える、
    を行わせる命令を記憶した非一時的コンピュータ可読記憶媒体。
JP2018515971A 2015-09-29 2016-09-21 再編成を備えるビデオコーディングのための非分離可能2次変換 Active JP6995744B2 (ja)

Applications Claiming Priority (11)

Application Number Priority Date Filing Date Title
US201562234644P 2015-09-29 2015-09-29
US62/234,644 2015-09-29
US201662294897P 2016-02-12 2016-02-12
US62/294,897 2016-02-12
US201662323496P 2016-04-15 2016-04-15
US62/323,496 2016-04-15
US201662337736P 2016-05-17 2016-05-17
US62/337,736 2016-05-17
US15/270,507 US10681379B2 (en) 2015-09-29 2016-09-20 Non-separable secondary transform for video coding with reorganizing
US15/270,507 2016-09-20
PCT/US2016/052935 WO2017058615A1 (en) 2015-09-29 2016-09-21 Non-separable secondary transform for video coding with reorganizing

Publications (3)

Publication Number Publication Date
JP2018530247A true JP2018530247A (ja) 2018-10-11
JP2018530247A5 JP2018530247A5 (ja) 2019-10-03
JP6995744B2 JP6995744B2 (ja) 2022-01-17

Family

ID=58406050

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2018515931A Active JP6884770B2 (ja) 2015-09-29 2016-09-21 ビデオコーディングのための非分離可能2次変換
JP2018515971A Active JP6995744B2 (ja) 2015-09-29 2016-09-21 再編成を備えるビデオコーディングのための非分離可能2次変換

Family Applications Before (1)

Application Number Title Priority Date Filing Date
JP2018515931A Active JP6884770B2 (ja) 2015-09-29 2016-09-21 ビデオコーディングのための非分離可能2次変換

Country Status (9)

Country Link
US (3) US10681379B2 (ja)
EP (2) EP3357243A1 (ja)
JP (2) JP6884770B2 (ja)
KR (2) KR20180063187A (ja)
CN (2) CN108141597B (ja)
AU (2) AU2016332317A1 (ja)
BR (2) BR112018006398A2 (ja)
TW (2) TW201715888A (ja)
WO (2) WO2017058615A1 (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020251254A1 (ko) * 2019-06-10 2020-12-17 주식회사 엑스리스 영상 신호 부호화/복호화 방법 및 이를 위한 장치
JP2023513609A (ja) * 2020-11-11 2023-03-31 テンセント・アメリカ・エルエルシー デコーダが実行するビデオデコーディングの方法、装置、及びプログラム、並びにエンコーダが実行するビデオコーディングの方法
JP2023513772A (ja) * 2020-11-11 2023-04-03 テンセント・アメリカ・エルエルシー ビデオコーディングのための方法、装置およびコンピュータプログラム
US11973984B2 (en) 2019-05-15 2024-04-30 Xris Corporation Method for encoding/decoding image signal and apparatus therefor

Families Citing this family (218)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107211146A (zh) * 2014-11-21 2017-09-26 Vid拓展公司 一维变换模式和系数扫描顺序
CN106358042B (zh) * 2015-07-17 2020-10-09 恩智浦美国有限公司 使用视频图像的帧间预测的并行解码器
US10681379B2 (en) 2015-09-29 2020-06-09 Qualcomm Incorporated Non-separable secondary transform for video coding with reorganizing
CN108701462B (zh) * 2016-03-21 2020-09-25 华为技术有限公司 加权矩阵系数的自适应量化
US10623774B2 (en) 2016-03-22 2020-04-14 Qualcomm Incorporated Constrained block-level optimization and signaling for video coding tools
CN117499645A (zh) * 2016-04-29 2024-02-02 英迪股份有限公司 图像解码装置、图像编码装置和用于发送比特流的装置
EP3442231A4 (en) * 2016-05-02 2019-12-04 Industry - University Cooperation Foundation Hanyang University BILDCODE / DECODE PROCESS AND DEVICE USING INTRA-SCREEN PREDICTION
CA3022221A1 (en) * 2016-05-13 2017-11-16 Sony Corporation Apparatus and method for image processing for suppressing a reduction of coding efficiency
KR102397673B1 (ko) * 2016-05-13 2022-05-16 소니그룹주식회사 화상 처리 장치 및 방법
US10887626B2 (en) * 2016-05-13 2021-01-05 Sharp Kabushiki Kaisha Image decoding device and image encoding device
US10547854B2 (en) 2016-05-13 2020-01-28 Qualcomm Incorporated Neighbor based signaling of intra prediction modes
CA3025488A1 (en) * 2016-05-25 2017-11-30 Arris Enterprises Llc Weighted angular prediction for intra coding
WO2017205703A1 (en) 2016-05-25 2017-11-30 Arris Enterprises Llc Improved weighted angular prediction coding for intra coding
MX2018014491A (es) 2016-05-25 2019-08-14 Arris Entpr Llc Metodo de particionamiento de bloque general.
US20210343388A1 (en) * 2016-05-31 2021-11-04 Digital Hospital, Inc. Dosage Determination Apparatus
CN117221597A (zh) * 2016-06-22 2023-12-12 Lx 半导体科技有限公司 图像编码/解码方法以及图像数据的传输方法
CN117412044A (zh) * 2016-07-13 2024-01-16 韩国电子通信研究院 图像编码/解码方法和装置
CN116634145A (zh) * 2016-08-08 2023-08-22 Lg电子株式会社 视频解码方法、视频信号编码方法及其介质
KR102471208B1 (ko) * 2016-09-20 2022-11-25 주식회사 케이티 비디오 신호 처리 방법 및 장치
US10880564B2 (en) 2016-10-01 2020-12-29 Qualcomm Incorporated Transform selection for video coding
US10506228B2 (en) 2016-10-04 2019-12-10 Qualcomm Incorporated Variable number of intra modes for video coding
US20180103251A1 (en) * 2016-10-07 2018-04-12 Industrial Technology Research Institute Method for selecting prediction mode of intra prediction, video encoding device and image processing apparatus
US11095893B2 (en) 2016-10-12 2021-08-17 Qualcomm Incorporated Primary transform and secondary transform in video coding
WO2018117892A1 (en) 2016-12-23 2018-06-28 Huawei Technologies Co., Ltd. An intra-prediction apparatus for extending a set of predetermined directional intra-prediction modes
US10277895B2 (en) * 2016-12-28 2019-04-30 Arris Enterprises Llc Adaptive unequal weight planar prediction
EP3349451A1 (en) * 2017-01-11 2018-07-18 Thomson Licensing Method and apparatus for selecting a coding mode used for encoding/decoding a residual block
US20200177889A1 (en) * 2017-03-21 2020-06-04 Lg Electronics Inc. Transform method in image coding system and apparatus for same
US20180288439A1 (en) * 2017-03-31 2018-10-04 Mediatek Inc. Multiple Transform Prediction
KR102257829B1 (ko) 2017-04-13 2021-05-28 엘지전자 주식회사 영상의 부호화/복호화 방법 및 이를 위한 장치
US10855997B2 (en) * 2017-04-14 2020-12-01 Mediatek Inc. Secondary transform kernel size selection
JP2020109884A (ja) * 2017-04-28 2020-07-16 シャープ株式会社 動画像符号化装置及び動画像復号装置
JP6767579B2 (ja) * 2017-06-01 2020-10-14 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America 符号化装置、符号化方法、復号装置及び復号方法
WO2018221554A1 (ja) * 2017-06-01 2018-12-06 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ 符号化装置、符号化方法、復号装置及び復号方法
KR102466945B1 (ko) * 2017-06-21 2022-11-14 엘지전자 주식회사 영상 코딩 시스템에서 인트라 예측에 따른 영상 디코딩 방법 및 장치
US11134272B2 (en) * 2017-06-29 2021-09-28 Qualcomm Incorporated Memory reduction for non-separable transforms
WO2019009129A1 (ja) * 2017-07-03 2019-01-10 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ 符号化装置、復号装置、符号化方法及び復号方法
JP2019017066A (ja) * 2017-07-03 2019-01-31 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America 符号化装置、復号装置、符号化方法及び復号方法
WO2019009618A1 (ko) * 2017-07-04 2019-01-10 삼성전자 주식회사 영상 부호화 방법 및 장치, 영상 복호화 방법 및 장치
TWI777907B (zh) * 2017-07-13 2022-09-11 美商松下電器(美國)知識產權公司 編碼裝置、編碼方法、解碼裝置、解碼方法及電腦可讀取之非暫時性媒體
TWI777904B (zh) * 2017-07-13 2022-09-11 美商松下電器(美國)知識產權公司 編碼裝置、解碼裝置及記錄媒體
WO2019022099A1 (ja) * 2017-07-28 2019-01-31 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ 符号化装置、復号装置、符号化方法及び復号方法
KR20200031102A (ko) * 2017-07-28 2020-03-23 파나소닉 인텔렉츄얼 프로퍼티 코포레이션 오브 아메리카 부호화 장치, 복호 장치, 부호화 방법 및 복호 방법
CN115442606A (zh) * 2017-07-31 2022-12-06 韩国电子通信研究院 对图像编码和解码的方法及存储比特流的计算机可读介质
WO2019027302A1 (ko) * 2017-08-04 2019-02-07 엘지전자 주식회사 비디오 압축을 위한 변환을 구성하는 방법 및 장치
KR102591095B1 (ko) * 2017-09-28 2023-10-19 삼성전자주식회사 부호화 방법 및 그 장치, 복호화 방법 및 그 장치
WO2019076138A1 (en) 2017-10-16 2019-04-25 Huawei Technologies Co., Ltd. METHOD AND APPARATUS FOR ENCODING
EP3709640A4 (en) 2017-11-09 2021-08-25 Samsung Electronics Co., Ltd. DEVICE AND METHOD FOR ENCODING IMAGES ON THE BASIS OF MOTION VECTOR RESOLUTION, AND DECODING DEVICE AND METHOD
US20200374516A1 (en) * 2017-12-04 2020-11-26 Lg Electronics Inc. Image decoding method and apparatus based on efficient transformation of chroma component in image coding system
EP3496401A1 (en) * 2017-12-05 2019-06-12 Thomson Licensing Method and apparatus for video encoding and decoding based on block shape
WO2019117634A1 (ko) * 2017-12-15 2019-06-20 엘지전자 주식회사 2차 변환에 기반한 영상 코딩 방법 및 그 장치
KR102489150B1 (ko) * 2017-12-15 2023-01-17 엘지전자 주식회사 비분리 2차 변환에 기반한 영상 코딩 방법 및 그 장치
US11218731B2 (en) * 2017-12-15 2022-01-04 Lg Electronics Inc. Image coding method on basis of transformation and device therefor
WO2019126163A1 (en) * 2017-12-18 2019-06-27 Arris Enterprises, Inc. System and method for constructing a plane for planar prediction
CN115776572A (zh) 2017-12-21 2023-03-10 Lg电子株式会社 图像解码和编码方法、存储比特流的介质和数据发送方法
US20200359025A1 (en) * 2017-12-22 2020-11-12 Interdigital Vc Holdings, Inc. Method and apparatus for video compression using efficient multiple transforms
CN115278239A (zh) * 2017-12-28 2022-11-01 松下电器(美国)知识产权公司 编码装置、解码装置和存储介质
JP7121133B2 (ja) 2018-02-23 2022-08-17 華為技術有限公司 ビデオ符号化のための位置依存の空間変化変換
CN108322745B (zh) * 2018-02-28 2019-12-03 中南大学 一种基于不可分二次变换模式的帧内快速选择方法
US10567801B2 (en) 2018-03-07 2020-02-18 Tencent America LLC Method and apparatus for video coding with primary and secondary transforms
JP2021519546A (ja) * 2018-03-29 2021-08-10 フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン 映像符号化のための候補変換セットの決定
US11647214B2 (en) 2018-03-30 2023-05-09 Qualcomm Incorporated Multiple transforms adjustment stages for video coding
PL3764649T3 (pl) * 2018-04-01 2024-01-22 Lg Electronics Inc. Przetwarzanie sygnału wideo z wykorzystaniem skróconego przekształcenia wtórnego
JP2021517795A (ja) * 2018-04-01 2021-07-26 エルジー エレクトロニクス インコーポレイティド 分割されたブロックに2次変換を適用して、ビデオ信号を処理する方法及び装置
CN110213576B (zh) * 2018-05-03 2023-02-28 腾讯科技(深圳)有限公司 视频编码方法、视频编码装置、电子设备及存储介质
DK3782361T3 (da) 2018-05-31 2023-10-16 Huawei Tech Co Ltd Rumligt varierende transformation med adaptiv transformationstype
US10645396B2 (en) * 2018-06-04 2020-05-05 Tencent America LLC Method and apparatus for implicit transform splitting
KR20210038846A (ko) 2018-06-29 2021-04-08 브이아이디 스케일, 인크. Affine motion 모델 기반 비디오 코딩을 위한 적응형 제어 포인트 선택
US10687081B2 (en) 2018-06-29 2020-06-16 Tencent America LLC Method, apparatus and medium for decoding or encoding
AU2018204775A1 (en) * 2018-06-29 2020-01-16 Canon Kabushiki Kaisha Method, apparatus and system for encoding and decoding a transformed block of video samples
US10666981B2 (en) * 2018-06-29 2020-05-26 Tencent America LLC Method, apparatus and medium for decoding or encoding
CN116320413A (zh) * 2018-07-02 2023-06-23 Lg电子株式会社 对视频信号进行编解码的设备和发送图像的数据的设备
EP3806475B1 (en) * 2018-07-06 2023-05-10 LG Electronics, Inc. Transform-based image coding method and device
KR102555966B1 (ko) * 2018-07-12 2023-07-17 엘지전자 주식회사 비디오 신호를 처리하기 위한 방법 및 장치
CN111567041B (zh) 2018-07-13 2022-04-29 瑞典爱立信有限公司 视频编码器和/或视频解码器中的变换选择
US11166044B2 (en) * 2018-07-31 2021-11-02 Tencent America LLC Method and apparatus for improved compound orthonormal transform
EP3826303A4 (en) * 2018-08-12 2021-05-26 LG Electronics Inc. IMAGE SIGNAL PROCESSING METHOD AND APPARATUS
CN115037934B (zh) * 2018-09-02 2024-04-26 Lg电子株式会社 用于图像信号编码和解码的方法及计算机可读记录介质
WO2020046085A1 (ko) * 2018-09-02 2020-03-05 엘지전자 주식회사 영상 신호를 처리하기 위한 방법 및 장치
EP4152748A1 (en) * 2018-09-02 2023-03-22 LG Electronics, Inc. Method and apparatus for processing image signal
EP3723376A4 (en) * 2018-09-02 2021-01-27 LG Electronics Inc. VIDEO SIGNAL CODING / DECODING PROCESS AND DEVICE FOR THE SAME
WO2020050668A1 (ko) * 2018-09-05 2020-03-12 엘지전자 주식회사 영상 신호를 처리하기 위한 방법 및 장치
WO2020050665A1 (ko) * 2018-09-05 2020-03-12 엘지전자 주식회사 비디오 신호의 부호화/복호화 방법 및 이를 위한 장치
US10819979B2 (en) * 2018-09-06 2020-10-27 Tencent America LLC Coupled primary and secondary transform
EP3852374A4 (en) * 2018-09-23 2021-12-08 Lg Electronics Inc. PROCESS FOR ENCODING / DECODING VIDEO SIGNALS AND ASSOCIATED EQUIPMENT
US11218694B2 (en) * 2018-09-24 2022-01-04 Qualcomm Incorporated Adaptive multiple transform coding
WO2020067694A1 (ko) * 2018-09-24 2020-04-02 엘지전자 주식회사 영상 신호를 처리하기 위한 방법 및 장치
US11589075B2 (en) 2018-10-01 2023-02-21 Lg Electronics Inc. Encoding/decoding method for video signal and device therefor
US11128866B2 (en) 2018-10-18 2021-09-21 Qualcomm Incorporated Scans and last coefficient position coding for zero-out transforms
US11412260B2 (en) 2018-10-29 2022-08-09 Google Llc Geometric transforms for image compression
WO2020101321A1 (ko) * 2018-11-12 2020-05-22 엘지전자 주식회사 고주파 제로잉을 기반으로 변환 계수를 코딩하는 방법 및 그 장치
CN113302924A (zh) * 2018-11-22 2021-08-24 交互数字Vc控股公司 用于视频编码和解码的量化
WO2020116961A1 (ko) * 2018-12-06 2020-06-11 엘지전자 주식회사 이차 변환에 기반한 영상 코딩 방법 및 그 장치
US11284112B2 (en) * 2018-12-06 2022-03-22 Tencent America LLC Method and apparatus for a primary transform using an 8-bit transform core
GB2579824B (en) 2018-12-14 2022-05-18 British Broadcasting Corp Video encoding and video decoding
WO2020130577A1 (ko) * 2018-12-18 2020-06-25 엘지전자 주식회사 이차 변환에 기반한 영상 코딩 방법 및 그 장치
KR20210095138A (ko) * 2018-12-19 2021-07-30 엘지전자 주식회사 이차 변환에 기반한 영상 코딩 방법 및 그 장치
FI3879835T3 (fi) * 2018-12-19 2023-09-01 Lg Electronics Inc Sekundääriseen muunnokseen perustuva videonkoodausmenetelmä sekä sitä varten tarkoitettu laite
GB2580326A (en) 2018-12-28 2020-07-22 British Broadcasting Corp Video encoding and video decoding
US11102490B2 (en) * 2018-12-31 2021-08-24 Tencent America LLC Coefficient scanning methods on adaptive angle mode
WO2020141892A1 (ko) 2019-01-01 2020-07-09 엘지전자 주식회사 이차 변환에 기반한 영상 코딩 방법 및 그 장치
KR20210107118A (ko) * 2019-01-02 2021-08-31 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 통합된 변환 타입 시그널링 및 변환 타입 종속 변환 계수 레벨 코딩
KR20210080557A (ko) * 2019-01-07 2021-06-30 엘지전자 주식회사 이차 변환에 기반한 영상 코딩 방법 및 그 장치
CN116962678A (zh) 2019-01-12 2023-10-27 Lg电子株式会社 图像解码/编码方法、存储介质和图像数据发送方法
CN113302942B (zh) * 2019-02-01 2024-02-13 Lg电子株式会社 基于二次变换的图像编码方法及其设备
US11595663B2 (en) 2019-02-01 2023-02-28 Qualcomm Incorporated Secondary transform designs for partitioned transform units in video coding
CN113396592B (zh) 2019-02-02 2023-11-14 北京字节跳动网络技术有限公司 用于视频编解码中的帧内块复制的缓冲区管理
WO2020156547A1 (en) 2019-02-02 2020-08-06 Beijing Bytedance Network Technology Co., Ltd. Buffer resetting for intra block copy in video coding
US10986339B2 (en) * 2019-02-08 2021-04-20 Tencent America LLC Method and apparatus for harmonization between transform skip mode and multiple transform selection
US11190794B2 (en) * 2019-02-12 2021-11-30 Tencent America LLC Method and apparatus for video coding
EP3915265A4 (en) 2019-03-01 2022-06-22 Beijing Bytedance Network Technology Co., Ltd. DIRECTION-BASED PREDICTION FOR INTRA BLOCK COPY IN VIDEO CODING
CN113519164A (zh) * 2019-03-02 2021-10-19 北京字节跳动网络技术有限公司 对分割结构的限制
KR20210125506A (ko) 2019-03-04 2021-10-18 베이징 바이트댄스 네트워크 테크놀로지 컴퍼니, 리미티드 비디오 코딩에서 인트라 블록 복사를 위한 버퍼 관리
TWI753377B (zh) * 2019-03-12 2022-01-21 弗勞恩霍夫爾協會 用於影像及視訊寫碼之選擇性成分間變換(ict)技術
CN113632493A (zh) * 2019-03-13 2021-11-09 北京字节跳动网络技术有限公司 变换跳过模式中的子块变换
US11025937B2 (en) * 2019-03-16 2021-06-01 Tencent America LLC Method and apparatus for video coding
WO2020190113A1 (ko) * 2019-03-21 2020-09-24 삼성전자주식회사 블록 형태별로 블록 크기가 설정되는 비디오 부호화 방법 및 장치, 비디오 복호화 방법 및 장치
US11025909B2 (en) * 2019-03-21 2021-06-01 Tencent America LLC Method and apparatus for video coding
US11616966B2 (en) * 2019-04-03 2023-03-28 Mediatek Inc. Interaction between core transform and secondary transform
US11172211B2 (en) * 2019-04-04 2021-11-09 Tencent America LLC Method and apparatus for video coding
US11240534B2 (en) 2019-04-05 2022-02-01 Qualcomm Incorporated Extended multiple transform selection for video coding
CN113785588B (zh) 2019-04-12 2023-11-24 北京字节跳动网络技术有限公司 基于矩阵的帧内预测的色度编解码模式确定
CN118200567A (zh) * 2019-04-16 2024-06-14 Lg电子株式会社 图像解码和编码方法、数据的发送方法及存储介质
FI3944618T3 (fi) * 2019-04-16 2024-01-11 Lg Electronics Inc Muunnos matriisipohjaista intraennustusta varten kuvan koodauksessa
CN117499656A (zh) 2019-04-16 2024-02-02 北京字节跳动网络技术有限公司 帧内编解码模式下的矩阵推导
WO2020211776A1 (en) * 2019-04-16 2020-10-22 Mediatek Inc. Methods and apparatuses for coding video data with adaptive secondary transform signaling
CN118118665A (zh) 2019-04-16 2024-05-31 Lg电子株式会社 解码设备、编码设备和发送设备
EP3949423A4 (en) * 2019-04-16 2023-04-12 HFI Innovation Inc. METHODS AND DEVICES FOR ENCODING VIDEO DATA WITH SECONDARY TRANSFORMATION
EP3958561A4 (en) * 2019-04-16 2022-08-10 Panasonic Intellectual Property Corporation of America ENCODING DEVICE, DECODING DEVICE, ENCODING METHOD AND DECODING METHOD
EP3939260A4 (en) 2019-04-20 2022-07-06 Beijing Bytedance Network Technology Co., Ltd. SIGNALING OF SYNTAX ELEMENTS FOR CO-CODING OF CHROMINANCE RESIDUES
JP7256293B2 (ja) * 2019-04-23 2023-04-11 北京字節跳動網絡技術有限公司 符号化映像における二次変換の使用
KR20220002318A (ko) 2019-05-01 2022-01-06 베이징 바이트댄스 네트워크 테크놀로지 컴퍼니, 리미티드 필터링을 이용한 행렬 기반 인트라 예측
CN117097912A (zh) 2019-05-01 2023-11-21 北京字节跳动网络技术有限公司 基于矩阵的帧内预测的上下文编码
WO2020228673A1 (en) 2019-05-10 2020-11-19 Beijing Bytedance Network Technology Co., Ltd. Conditional use of reduced secondary transform for video processing
US11032572B2 (en) 2019-05-17 2021-06-08 Qualcomm Incorporated Low-frequency non-separable transform signaling based on zero-out patterns for video coding
KR20220011127A (ko) 2019-05-22 2022-01-27 베이징 바이트댄스 네트워크 테크놀로지 컴퍼니, 리미티드 업샘플링을 이용한 행렬 기반 인트라 예측
CN113940074A (zh) * 2019-05-27 2022-01-14 Lg电子株式会社 基于广角帧内预测和变换的图像编码方法和装置
US20220232255A1 (en) * 2019-05-30 2022-07-21 Sharp Kabushiki Kaisha Image decoding apparatus
WO2020239119A1 (en) 2019-05-30 2020-12-03 Beijing Bytedance Network Technology Co., Ltd. Adaptive loop filtering for chroma components
JP2022534999A (ja) * 2019-05-31 2022-08-04 インターデジタル ヴイシー ホールディングス, インコーポレイテッド 暗黙的多重変換選択の変換選択
WO2020239017A1 (en) * 2019-05-31 2020-12-03 Beijing Bytedance Network Technology Co., Ltd. One-step downsampling process in matrix-based intra prediction
US11134275B2 (en) * 2019-06-04 2021-09-28 Tencent America LLC Method and apparatus for performing primary transform based on filtering of blocks
US11218728B2 (en) * 2019-06-04 2022-01-04 Tencent America LLC Method and apparatus for video coding
CN113950836B (zh) 2019-06-05 2024-01-12 北京字节跳动网络技术有限公司 基于矩阵的帧内预测的上下文确定
CN117336484A (zh) * 2019-06-06 2024-01-02 Lg电子株式会社 图像解码和编码设备及发送比特流的设备
EP3967032A4 (en) 2019-06-07 2022-07-27 Beijing Bytedance Network Technology Co., Ltd. CONDITIONAL SIGNALING OF A REDUCED SECONDARY TRANSFORM FOR VIDEO BIANARY FLOWS
US11252410B2 (en) * 2019-06-11 2022-02-15 Tencent America LLC Method and apparatus for video coding
US11695960B2 (en) 2019-06-14 2023-07-04 Qualcomm Incorporated Transform and last significant coefficient position signaling for low-frequency non-separable transform in video coding
CN113994696A (zh) * 2019-06-15 2022-01-28 北京字节跳动网络技术有限公司 编解码视频中的块尺寸相关的二次变换的使用
EP3989579A4 (en) * 2019-06-18 2023-06-21 Electronics and Telecommunications Research Institute PICTURE ENCODING/DECODING METHOD AND APPARATUS USING SECONDARY TRANSFORMATION AND RECORDING MEDIUM WITH BITSTREAM STORED THEREON
KR20210158400A (ko) 2019-06-19 2021-12-30 엘지전자 주식회사 영상 코딩에서 변환 커널 세트를 나타내는 정보의 시그널링
WO2020256482A1 (ko) * 2019-06-19 2020-12-24 엘지전자 주식회사 변환에 기반한 영상 코딩 방법 및 그 장치
EP3754981A1 (en) * 2019-06-20 2020-12-23 InterDigital VC Holdings, Inc. Explicit signaling of reduced secondary transform kernel
US11949870B2 (en) 2019-06-21 2024-04-02 Qualcomm Incorporated Context modeling for low-frequency non-separable transformation signaling for video coding
JP6912522B2 (ja) * 2019-06-24 2021-08-04 Kddi株式会社 画像復号装置、画像復号方法及びプログラム
KR20230088845A (ko) 2019-06-25 2023-06-20 삼성전자주식회사 2차 변환을 이용하는 비디오 신호 처리 방법 및 장치
CN112135148B (zh) * 2019-06-25 2022-05-10 华为技术有限公司 非可分离变换方法以及设备
GB2585030A (en) * 2019-06-25 2020-12-30 British Broadcasting Corp Method of signalling in a video codec
EP3981151A4 (en) 2019-07-06 2022-08-24 Beijing Bytedance Network Technology Co., Ltd. VIRTUAL PREDICTION BUFFER FOR INTRA-BLOCK COPY IN VIDEO ENCODING
MX2022000110A (es) 2019-07-10 2022-02-10 Beijing Bytedance Network Tech Co Ltd Identificacion de muestras para la copia intra-bloque en codificacion de video.
CN117579816A (zh) 2019-07-11 2024-02-20 北京字节跳动网络技术有限公司 用于视频编解码中的帧内块复制的比特流一致性约束
KR20220024500A (ko) 2019-07-12 2022-03-03 엘지전자 주식회사 변환에 기반한 영상 코딩 방법 및 그 장치
CN114342409A (zh) * 2019-07-12 2022-04-12 Lg 电子株式会社 基于变换的图像编译方法及其设备
CN114208183A (zh) 2019-08-03 2022-03-18 北京字节跳动网络技术有限公司 视频的缩减二次变换中基于位置的模式导出
CN114208178A (zh) * 2019-08-06 2022-03-18 交互数字Vc控股法国有限公司 用于视频编码和解码的二次变换
CN114450961A (zh) * 2019-08-08 2022-05-06 Lg 电子株式会社 基于变换的图像编译方法及设备
CN114223208B (zh) * 2019-08-17 2023-12-29 北京字节跳动网络技术有限公司 为视频中的缩减二次变换的边信息的上下文建模
US11677984B2 (en) 2019-08-20 2023-06-13 Qualcomm Incorporated Low-frequency non-separable transform (LFNST) signaling
JP2022548204A (ja) * 2019-09-12 2022-11-17 アリババ グループ ホウルディング リミテッド 変換スキップモードで映像データを符号化するための方法及び装置
AU2019232801A1 (en) * 2019-09-17 2021-04-01 Canon Kabushiki Kaisha Method, apparatus and system for encoding and decoding a block of video samples
CN110636313B (zh) * 2019-09-18 2022-07-15 浙江大华技术股份有限公司 变换、二次变换矩阵训练方法、编码器及相关装置
US11184617B2 (en) 2019-09-19 2021-11-23 Qualcomm Incorporated Transform unit design for video coding
KR20220077908A (ko) * 2019-09-19 2022-06-09 주식회사 윌러스표준기술연구소 스케일링 프로세스를 사용하는 비디오 신호 처리 방법 및 장치
CN114424575A (zh) * 2019-09-20 2022-04-29 诺基亚技术有限公司 用于视频编解码和解码的装置、方法和计算机程序
KR20220036960A (ko) * 2019-09-20 2022-03-23 엘지전자 주식회사 변환에 기반한 영상 코딩 방법 및 그 장치
US11153576B2 (en) 2019-09-20 2021-10-19 Qualcomm Incorporated Scaling matrices and signaling for video coding
CN114731434B (zh) * 2019-09-21 2023-06-30 Lg电子株式会社 基于变换的图像编码方法及其装置
WO2021054779A1 (ko) * 2019-09-21 2021-03-25 엘지전자 주식회사 변환에 기반한 영상 코딩 방법 및 그 장치
US20220353504A1 (en) * 2019-09-23 2022-11-03 Lg Electronics Inc. Image coding method based on transform, and device therefor
US11206400B2 (en) 2019-09-26 2021-12-21 Qualcomm Incorporated Low-frequency non-separable transform (LFNST) simplifications
EP4017010A4 (en) * 2019-10-04 2022-11-16 LG Electronics Inc. TRANSFORM-BASED IMAGE CODING METHOD AND APPARATUS
EP4042689A4 (en) 2019-10-28 2023-06-07 Beijing Bytedance Network Technology Co., Ltd. SIGNALING AND SYNTAX ANALYSIS BASED ON A COLOR COMPONENT
JP7402016B2 (ja) * 2019-11-06 2023-12-20 オッポ広東移動通信有限公司 画像復号装置及び画像符号化装置
CA3161299A1 (en) * 2019-11-11 2021-05-20 Lg Electronics Inc. Image coding method based on conversion, and device for same
JP2023500732A (ja) * 2019-11-11 2023-01-10 エルジー エレクトロニクス インコーポレイティド 変換に基づく映像コーディング方法及びその装置
US20220400266A1 (en) * 2019-11-11 2022-12-15 Lg Electronics Inc. Transformation-based image coding method and device therefor
BR112022009304A2 (pt) * 2019-11-13 2022-08-09 Lg Electronics Inc Método de codificação de imagem baseado em transformada e aparelho para o mesmo
CN114946189A (zh) * 2019-11-13 2022-08-26 Lg电子株式会社 基于变换的图像编码方法及其装置
WO2021096295A1 (ko) * 2019-11-13 2021-05-20 엘지전자 주식회사 변환에 기반한 영상 코딩 방법 및 그 장치
WO2021107648A1 (ko) * 2019-11-26 2021-06-03 한국전자통신연구원 영상 부호화/복호화 방법, 장치 및 비트스트림을 저장한 기록 매체
US11375220B2 (en) * 2019-11-27 2022-06-28 Tencent America LLC Method and apparatus for video decoding using a nominal directional mode and an angular offset
CN114830655B (zh) * 2019-12-12 2023-08-18 寰发股份有限公司 视频编解码的方法与装置
US11470353B2 (en) 2019-12-20 2022-10-11 Qualcomm Incorporated Low-frequency non-separable transform (LFNST) with reduced zero-out in video coding
US11457229B2 (en) 2019-12-23 2022-09-27 Qualcomm Incorporated LFNST signaling for chroma based on chroma transform skip
WO2021134303A1 (zh) * 2019-12-30 2021-07-08 Oppo广东移动通信有限公司 变换方法、编码器、解码器以及存储介质
CN114830658A (zh) * 2019-12-31 2022-07-29 Oppo广东移动通信有限公司 变换方法、编码器、解码器以及存储介质
WO2021134635A1 (zh) * 2019-12-31 2021-07-08 Oppo广东移动通信有限公司 变换方法、编码器、解码器以及存储介质
WO2021141443A1 (ko) * 2020-01-10 2021-07-15 엘지전자 주식회사 변환에 기반한 영상 코딩 방법 및 그 장치
WO2021180020A1 (en) * 2020-03-07 2021-09-16 Beijing Bytedance Network Technology Co., Ltd. Implicit multiple transform set signaling in video coding
US11582491B2 (en) 2020-03-27 2023-02-14 Qualcomm Incorporated Low-frequency non-separable transform processing in video coding
US20210321137A1 (en) 2020-03-30 2021-10-14 Qualcomm Incorporated Low-frequency non-separable transform index signaling in video coding
US11616983B2 (en) 2020-05-05 2023-03-28 Tencent America LLC Joint component secondary transform
US11272212B2 (en) * 2020-05-12 2022-03-08 Tencent America LLC Tuned line graph transforms
US11310529B2 (en) * 2020-05-27 2022-04-19 Tencent America LLC Mode-dependent joint component transform
US11785254B2 (en) * 2020-05-29 2023-10-10 Tencent America LLC Implicit mode dependent primary transforms
US11606577B2 (en) 2020-06-09 2023-03-14 Alibaba Group Holding Limited Method for processing adaptive color transform and low-frequency non-separable transform in video coding
US11206428B1 (en) 2020-07-14 2021-12-21 Tencent America LLC Method and apparatus for frequency-dependent joint component secondary transform
US11683490B2 (en) 2020-09-10 2023-06-20 Tencent America LLC Context adaptive transform set
US11871010B2 (en) 2020-10-02 2024-01-09 Qualcomm Incorporated Extended low-frequency non-separable transform (LFNST) designs with worst-case complexity handling
US11611770B2 (en) * 2020-10-14 2023-03-21 Tencent America LLC Method and apparatus for video coding
US11924471B2 (en) 2020-11-12 2024-03-05 Qualcomm Incorporated Context-based transform index signaling in video coding
CN114598871A (zh) * 2020-12-03 2022-06-07 杭州海康威视数字技术股份有限公司 一种编码、解码方法、装置及其设备
KR20230169985A (ko) * 2021-04-12 2023-12-18 엘지전자 주식회사 저주파 비분리 변환 설계 방법 및 장치
US20220337854A1 (en) * 2021-04-16 2022-10-20 Tencent America LLC Interaction between transform partitioning and primary/secondary transform type selection
WO2022238616A2 (en) * 2021-05-12 2022-11-17 Nokia Technologies Oy A method, an apparatus and a computer program product for video encoding and video decoding
WO2023282625A1 (ko) * 2021-07-06 2023-01-12 엘지전자 주식회사 비분리 1차 변환에 기반한 영상 부호화/복호화 방법, 장치 및 비트스트림을 저장하는 기록 매체
CN116636205A (zh) * 2021-08-30 2023-08-22 腾讯美国有限责任公司 次级变换系数的扫描顺序
US20230078100A1 (en) * 2021-08-30 2023-03-16 Tencent America LLC Scan order of secondary transform coefficients
WO2023191332A1 (ko) * 2022-03-28 2023-10-05 현대자동차주식회사 적응적 다중변환선택을 이용하는 비디오 코딩을 위한 방법 및 장치

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2011016246A1 (ja) * 2009-08-06 2011-02-10 パナソニック株式会社 符号化方法、復号方法、符号化装置及び復号装置
WO2012014461A1 (ja) * 2010-07-28 2012-02-02 パナソニック株式会社 符号化方法および復号化方法

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8488668B2 (en) * 2007-06-15 2013-07-16 Qualcomm Incorporated Adaptive coefficient scanning for video coding
US9172968B2 (en) 2010-07-09 2015-10-27 Qualcomm Incorporated Video coding using directional transforms
US10992958B2 (en) * 2010-12-29 2021-04-27 Qualcomm Incorporated Video coding using mapped transforms and scanning modes
AU2012232992A1 (en) * 2012-09-28 2014-04-17 Canon Kabushiki Kaisha Method, apparatus and system for encoding and decoding the transform units of a coding unit
US10306229B2 (en) 2015-01-26 2019-05-28 Qualcomm Incorporated Enhanced multiple transforms for prediction residual
US9998742B2 (en) 2015-01-27 2018-06-12 Qualcomm Incorporated Adaptive cross component residual prediction
US10681379B2 (en) * 2015-09-29 2020-06-09 Qualcomm Incorporated Non-separable secondary transform for video coding with reorganizing

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2011016246A1 (ja) * 2009-08-06 2011-02-10 パナソニック株式会社 符号化方法、復号方法、符号化装置及び復号装置
WO2012014461A1 (ja) * 2010-07-28 2012-02-02 パナソニック株式会社 符号化方法および復号化方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
CHEN, JIANLE ET AL.: "Algorithm Description of Joint Exploration Test Model 1", JOINT VIDEO EXPLORATION TEAM (JVET) OF ITU-T SG 16 WP 3 AND ISO/IEC JTC 1/SC 29/WG 11 1ND MEETING: G, vol. JVET-A1001 (version 1), JPN6020036474, October 2015 (2015-10-01), pages 18 - 19, ISSN: 0004489233 *
YE, YAN AND KARCZEWICZ, MARTA: "Improved h.264 intra coding based on bi-directional intra prediction, directional transform, and ada", 2008 15TH IEEE INTERNATIONAL CONFERENCE ON IMAGE PROCESSIN, JPN6020036473, 12 December 2008 (2008-12-12), pages 2116 - 2119, ISSN: 0004489232 *

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11973984B2 (en) 2019-05-15 2024-04-30 Xris Corporation Method for encoding/decoding image signal and apparatus therefor
WO2020251254A1 (ko) * 2019-06-10 2020-12-17 주식회사 엑스리스 영상 신호 부호화/복호화 방법 및 이를 위한 장치
JP2023513609A (ja) * 2020-11-11 2023-03-31 テンセント・アメリカ・エルエルシー デコーダが実行するビデオデコーディングの方法、装置、及びプログラム、並びにエンコーダが実行するビデオコーディングの方法
JP2023513772A (ja) * 2020-11-11 2023-04-03 テンセント・アメリカ・エルエルシー ビデオコーディングのための方法、装置およびコンピュータプログラム
JP7413552B2 (ja) 2020-11-11 2024-01-15 テンセント・アメリカ・エルエルシー デコーダが実行するビデオデコーディングの方法、装置、及びプログラム、並びにエンコーダが実行するビデオコーディングの方法

Also Published As

Publication number Publication date
WO2017058614A1 (en) 2017-04-06
US10873762B2 (en) 2020-12-22
EP3357242B1 (en) 2023-12-06
TW201715888A (zh) 2017-05-01
WO2017058615A1 (en) 2017-04-06
CN108141596B (zh) 2022-03-08
US20200092583A1 (en) 2020-03-19
EP3357243A1 (en) 2018-08-08
JP2018530245A (ja) 2018-10-11
BR112018006398A2 (pt) 2018-10-09
CN108141597A (zh) 2018-06-08
JP6995744B2 (ja) 2022-01-17
JP6884770B2 (ja) 2021-06-09
TW201722152A (zh) 2017-06-16
KR20180063186A (ko) 2018-06-11
BR112018006367A2 (pt) 2018-10-09
US10491922B2 (en) 2019-11-26
EP3357242C0 (en) 2023-12-06
AU2016332317A1 (en) 2018-04-26
KR20180063187A (ko) 2018-06-11
US20170094314A1 (en) 2017-03-30
CN108141597B (zh) 2022-03-08
US10681379B2 (en) 2020-06-09
AU2016332318A1 (en) 2018-04-26
CN108141596A (zh) 2018-06-08
US20170094313A1 (en) 2017-03-30
EP3357242A1 (en) 2018-08-08

Similar Documents

Publication Publication Date Title
JP6884770B2 (ja) ビデオコーディングのための非分離可能2次変換
KR102435840B1 (ko) 비분리형 변환들을 위한 메모리 감소
KR102519245B1 (ko) 강화된 다중 변환을 위한 룩-업 테이블
CN109716772B (zh) 用于视频译码的变换选择
JP6903644B2 (ja) ビデオコーディングのために位置依存の予測組合せを使用する改善されたビデオイントラ予測
KR20210142642A (ko) 비디오 코딩을 위한 확장된 다중 변환 선택
JP2018537908A (ja) ビデオデータの符号情報をコーディングすること
TW201711468A (zh) 使用一全文自適應二進位算術寫碼設計來寫碼資料
JP2017523685A (ja) イントラブロックコピーイングのためのブロックベクトルコーディング
JP2017513342A (ja) ゼロアウトされた係数を使用した低複雑な順変換のためのシステムおよび方法
JP2016534644A (ja) イントラブロックコピーのための残差予測
JP7455840B2 (ja) ビデオコーディングのためのツリーベース変換ユニット(tu)区分

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20180619

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190826

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20190826

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20200813

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20200929

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20201225

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20210420

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210719

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20211116

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20211215

R150 Certificate of patent or registration of utility model

Ref document number: 6995744

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150