JP7446988B2 - ビデオ圧縮のための変換を構成する方法および装置 - Google Patents

ビデオ圧縮のための変換を構成する方法および装置 Download PDF

Info

Publication number
JP7446988B2
JP7446988B2 JP2020505860A JP2020505860A JP7446988B2 JP 7446988 B2 JP7446988 B2 JP 7446988B2 JP 2020505860 A JP2020505860 A JP 2020505860A JP 2020505860 A JP2020505860 A JP 2020505860A JP 7446988 B2 JP7446988 B2 JP 7446988B2
Authority
JP
Japan
Prior art keywords
transform
transformation
amt
index
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2020505860A
Other languages
English (en)
Other versions
JP2020529782A (ja
JP2020529782A5 (ja
Inventor
ムンモ ク
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
LG Electronics Inc
Original Assignee
LG Electronics Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by LG Electronics Inc filed Critical LG Electronics Inc
Publication of JP2020529782A publication Critical patent/JP2020529782A/ja
Publication of JP2020529782A5 publication Critical patent/JP2020529782A5/ja
Application granted granted Critical
Publication of JP7446988B2 publication Critical patent/JP7446988B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/625Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using discrete cosine transform [DCT]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/12Selection from among a plurality of transforms or standards, e.g. selection between discrete cosine transform [DCT] and sub-band transform or selection between H.263 and H.264
    • H04N19/122Selection of transform size, e.g. 8x8 or 2x4x8 DCT; Selection of sub-band transforms of varying structure or type
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • H04N19/159Prediction type, e.g. intra-frame, inter-frame or bidirectional frame prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/18Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a set of transform coefficients
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • H04N19/463Embedding additional information in the video signal during the compression process by compressing encoding parameters before transmission
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/91Entropy coding, e.g. variable length coding [VLC] or arithmetic coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Discrete Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Description

本発明は、ビデオ信号を処理する方法および装置に関し、より具体的には、予測モード、ブロックサイズおよびブロック形状(block shape)の少なくとも1つにより区分される変換設定グループ(transform configuration group)別に変換組合せ(transform combination)を構成する技術に関する。
次世代ビデオコンテンツは、高解像度(high spatial resolution)、高フレームレート(率)(high frame rate)および画像表現の高次元化(high dimensionality of scene representation)という特徴を有する。そのようなコンテンツを処理するためには、メモリ記憶(格納)量(memory storage)、メモリアクセスレート(率)(memory access rate)および処理電力(processing power)の側面で多大な増加をもたらすだろう。
したがって、次世代ビデオコンテンツをより効率的に処理するためのコーディングツールをデザインする必要がある。特に、変換(transform)を適用するとき、符号化効率および複雑度の側面ではるかに効率的な変換を設計する必要がある。
本発明は、符号化効率および複雑度の側面ではるかに効率的な変換設定(transform configuration)を設計しようとする。
本発明は、予測モード、ブロックサイズおよびブロック形状(block shape)の少なくとも1つにより区分される変換設定グループ(transform configuration group)別に変換組合せ(transform combination)を構成する方法を提案する。
また、本発明は、新しい変換デザインを反映するためのエンコーダ/デコーダ構造を提案する。
上記課題を解決するために、
本発明は、DCT8(Discrete Cosine Transform type 8)に対してDST7(Discrete Sine Transform type 7)のカーネル係数データをそのまま使用するとともに、DST7の変形した形態に代替する方法を提供する。
また、本発明は、DST7をDST4に代替し、DCT8に対してDST4のカーネル係数データをそのまま使用するとともに、DCT4の変形した形態に代替する方法を提供する。
また、本発明は、予測モード、ブロックサイズおよびブロック形状(block shape)の少なくとも1つに基づいて変換設定グループ(transform configuration group)を構成し、1つの変換設定グループは、1つまたは複数の変換組合せで構成され、1つの変換組合せは、全ての行(row)および列(column)に対応する変換で構成されるとともに、各行(row)または列(column)に対応する変換は、相異なるように構成される方法を提供する。
また、本発明は、DST7またはDST4などの1つの変換とそれから変形された変換とに基づいて、全ての行(row)および列(column)に対する変換を構成する方法を提供する。
また、本発明は、全ての三角変換(trigonometric transforms)(8つのDCT、8つのDST)間に存在する線形関係を利用するか、変換入出力部分に前後処理過程を追加する方式により、全ての変換に対してそれぞれ導出(誘導)可能な変換集合を構成することができ、このように導出した変換集合の和集合を求めて変換組合せを決定するのに活用する方法を提供する。
本発明は、静止画像または動画を符号化するとき、決まった個数の変換に基づいて全ての行(row)および列(column)に対する変換を変換設定グループ(transform configuration group)別に構成することにより、よりコーディング効率の高い変換係数を生成することができる。
本発明が適用される実施形態として、ビデオ信号のエンコードが行われるエンコーダの概略ブロック図である。 本発明が適用される実施形態として、ビデオ信号のデコードが行われるデコーダの概略ブロック図である。 本発明が適用されることができる実施形態として、QT(QuadTree、以下「QT」という)によるブロック分割構造を説明する図である。 本発明が適用されることができる実施形態として、BT(Binary Tree、以下「BT」という)によるブロック分割構造を説明する図である。 本発明が適用されることができる実施形態として、TT(Ternary Tree、以下「TT」という)によるブロック分割構造を説明する図である。 本発明が適用されることができる実施形態として、AT(Asymmetric Tree、以下「AT」という)によるブロック分割構造を説明する図である。 本発明が適用される実施形態としてのエンコーダ内の変換および量子化部120/130、逆量子化および逆変換部140/150の概略ブロック図である。 本発明が適用される実施形態としてのデコーダ内の逆量子化および逆変換部220/230の概略ブロック図である。 本発明が適用される実施形態として、AMT(Adaptive Multiple Transforms)が適用される変換設定グループ(transform configuration group)を示す表である。 本発明が適用される実施形態として、AMT(Adaptive Multiple Transforms)が行われるエンコード過程を示すフローチャートである。 本発明が適用される実施形態として、AMT(Adaptive Multiple Transforms)が行われるデコード過程を示すフローチャートである。 本発明が適用される実施形態として、AMTフラグおよびAMTインデックスをエンコードする過程を説明するためのフローチャートである。 本発明が適用される実施形態として、AMTフラグおよびAMTインデックスに基づいて水平変換または垂直変換を行または列に適用するデコード過程を説明するためのフローチャートである。 本発明が適用される実施形態として、変換組合せの各行(row)または列(column)に対応する変換を相異なるように構成する方法を説明する図である。 本発明が適用される実施形態として、予測モード、ブロックサイズおよびブロック形状(block shape)の少なくとも1つに基づいて一般的な変換設定グループ(transform configuration group)を構成する方法を説明する図である。 本発明が適用される実施形態として、予測モード、ブロックサイズ、ブロック形状の少なくとも1つに基づく複数のテーブルに分割して変換設定グループを組み合わせる方法を説明する表である。 本発明が適用される実施形態として、予測モード、ブロックサイズ、ブロック形状の少なくとも1つに基づく複数のテーブルに分割して変換設定グループを組み合わせる方法を説明する表である。 本発明が適用される実施形態として、1つの変換セットを利用して変換設定グループ(transform configuration group)を構成する一例を示す図である。 本発明が適用される実施形態として、変換ブロックサイズに基づいて相異なる変換セットを利用して変換設定グループ(transform configuration group)を構成する一例を示す図である。 本発明が適用される実施形態として、スパンセット(spanned set)を構成する一例を示す図である。 本発明が適用されるビデオコーディングシステムを示す図である。 本発明が適用されるコンテンツのストリーミングシステムを示す図である。
本発明は、適応マルチ変換(Adaptive Multiple Transforms;AMT)に基づいてビデオ信号をデコードする方法であって、ビデオ信号からAMTインデックスを取得するステップであって、AMTインデックスは、変換設定グループ内の複数の変換組合せのいずれか1つを示し、変換設定グループは、DST7(Discrete Sine Transform type 7)およびDCT8(Discrete Cosine Transform type 8)を有するステップと、AMTインデックスに対応する変換組合せを導出するステップであって、変換組合せは、水平変換および垂直変換で構成され、DST7およびDCT8の少なくとも1つを有するステップと、変換組合せに基づいて、現ブロックに対して逆変換を行うステップと、逆変換された現ブロックを利用してビデオ信号を復元するステップと、を有し、AMTは、複数の変換組合せから適応的に選択される変換組合せに基づいて行われる変換方式を示す、ことを特徴とする方法を提供する。
本発明において、変換設定グループは、現ブロックの予測モード、ブロックサイズおよびブロック形状の少なくとも1つに基づいて設定される、ことを特徴とする。
本発明において、逆変換は、変換単位の幅および高さが両方とも32以下である場合にのみ適用される、ことを特徴とする。
本発明において、方法は、ビデオ信号からAMTフラグを取得するステップであって、AMTフラグは、AMTが行われるか否かを示すステップをさらに有し、AMTインデックスは、AMTフラグによってAMTが行われる場合に取得される、ことを特徴とする。
本発明において、方法は、AMTフラグによってAMTが行われる場合、0でない変換係数の個数が閾値より大きいか否かを確認するステップをさらに有し、AMTインデックスは、0でない変換係数の個数が閾値より大きい場合に取得される、ことを特徴とする。
本発明において、逆変換を行うステップは、垂直変換または水平変換がDST7またはDCT8である場合、DST7の逆変換またはDCT8の逆変換を列ごとに適用した後、行ごとに適用する、ことを特徴とする。
本発明において、垂直変換または水平変換は、各行ごとにおよび/または各列ごとに異なる変換が適用される、ことを特徴とする。
本発明において、AMTフラグまたはAMTインデックスは、シーケンス、ピクチャ、スライス、ブロック、コーディングユニット、変換ユニットおよび予測ユニットの少なくとも1つのレベルにおいて定義される、ことを特徴とする。
本発明は、適応マルチ変換(Adaptive Multiple Transforms;AMT)に基づいてビデオ信号をデコードする装置であって、ビデオ信号からAMTインデックスをパージングするパージング部であって、AMTインデックスは、変換設定グループ内の複数の変換組合せのいずれか1つを示し、変換設定グループは、DST7(Discrete Sine Transform type 7)およびDCT8(Discrete Cosine Transform type 8)を有するパージング部と、AMTインデックスに対応する変換組合せを導出し、変換組合せに基づいて現ブロックに対して逆変換を行う逆変換部と、逆変換された現ブロックを利用してビデオ信号を復元する復元部と、を有し、AMTは、複数の変換組合せから適応的に選択される変換組合せに基づいて行われる変換方式を示し、変換組合せは、水平変換および垂直変換で構成され、DST7およびDCT8の少なくとも1つを有する、ことを特徴とする装置を提供する。
本発明において、パージング部は、さらに、ビデオ信号からAMTが行われるか否かを示すAMTフラグをパージングし、AMTインデックスは、AMTフラグによってAMTが行われる場合に取得される、ことを特徴とする。
本発明において、逆変換部は、さらに、AMTフラグによってAMTが行われる場合、0でない変換係数の個数が閾値より大きいか否かを確認し、AMTインデックスは、0でない変換係数の個数が閾値より大きい場合に取得される、ことを特徴とする。
本発明において、逆変換部は、垂直変換または水平変換がDST7またはDCT8である場合、DST7の逆変換またはDCT8の逆変換を列ごとに適用した後、行ごとに適用する、ことを特徴とする。
〔発明を実施するための形態〕
以下、添付の図面を参照して本発明の実施形態の構成およびその作用を説明し、図面により説明される本発明の構成および作用は、1つの実施形態として説明されるものであり、これにより本発明の技術的思想並びにその核心構成および作用が制限されるものではない。
併せて、本発明で使われる用語は、できる限り現在広く使われる一般的な用語を選択したが、特定の場合は、出願人が任意に選定した用語を使用して説明する。そのような場合には該当部分の詳細説明でその意味を明確に記載するので、本発明の説明で使われた用語の名称だけで単純に解析されてはならず、その該当の用語の意味まで把握して解析(解釈)されるべきであることを明らかにする。
また、本発明で使われる用語は、発明を説明するために選択された一般的な用語であるが、類似の意味を有する他の用語がある場合、より適切な解析のために代替可能である。例えば、信号、データ、サンプル、ピクチャ、フレーム、ブロックなどの場合、各コーディング過程で適切に代替されて解析できるものである。また、パーティショニング(partitioning)、分解(decomposition)、スプリット(splitting)および分割(division)などの場合にも各コーディング過程で適切に代替され解析できるものである。
図1は、本発明が適用される実施形態として、ビデオ信号のエンコード(符号化)が行われるエンコーダの概略ブロック図を示す。
図1に示すように、エンコーダ100は、画像分割部110、変換部120、量子化部130、逆量子化部140、逆変換部150、フィルタリング部160、復号ピクチャバッファ(DPB:Decoded Picture Buffer)170、インター予測部180、イントラ予測部185およびエントロピエンコード部190を含んで構成される。
画像分割部110は、エンコーダ100に入力された入力画像(Input image)(または、ピクチャ、フレーム)を1つまたは複数の処理ユニットに分割する。例えば、上記処理ユニットは、コーディングツリーユニット(CTU:Coding Tree Unit)、コーディングユニット(CU:Coding Unit)、予測ユニット(PU:Prediction Unit)または変換ユニット(TU:Transform Unit)であり得る。
ただし、上記用語は、本発明に関する説明の便宜のために使用されるだけであり、本発明は、当該用語の定義に限定されない。また、本明細書では、説明の便宜のために、ビデオ信号をエンコードまたはデコードする過程で用いられる単位としてコーディングユニットという用語を使用するが、本発明は、それに限定されず、本発明の内容に応じて適切に解析可能である。
エンコーダ100は、入力画像信号から、インター予測部180またはイントラ予測部185から出力された予測信号(prediction signal)を減算して残差信号(residual signal)を生成し、生成された残差信号は、変換部120に送信される。
変換部120は、残差信号に変換技法を適用して変換係数(transform coefficient)を生成する。変換過程は、クアッドツリー(quadtree)構造の正方形ブロック、二分木(二進木、バイナリツリー)(binarytree)構造、三分木(三進木、3進ツリー)(ternary)構造または非対称ツリー(asymmetric)構造により分割されたブロック(正方形または長方形)に適用できる。
上記変換部120は、複数の変換(または、変換の組合せ(変換組合せ))に基づいて変換を行い、このような変換方式をEMT(Enhanced Multiple Transform)という。上記EMTは、AMT(Adaptive Multiple Transform)またはMTS(Multiple Transform Selection)と言ってもよい。
上記EMT(または、AMT、MTS)は、複数の変換(または、変換組合せ)から適応的に選択される変換(または、変換組合せ)に基づいて行われる変換方式を意味する。
上記複数の変換(または、変換組合せ)は、本明細書の図6および図12ないし図17で説明する変換(または、変換組合せ)を含んでもよい。本明細書において、上記変換または変換タイプは、例えば、DCT-Type 2、DCT-II、DCT-2、DCT2などと表記することができる。
上記変換部120は、次の実施形態を行うことができる。
本発明は、DCT8(Discrete Cosine Transform type 8)に対して、DST7(Discrete Sine Transform type 7)のカーネル係数データをそのまま使用するとともに、DST7の変形した形態に代替する方法を提供する。
また、本発明は、DST7をDST4に代替し、DCT8に対してDST4のカーネル係数データをそのまま使用するとともに、DCT4の変形した形態に代替する方法を提供する。
また、本発明は、予測モード、ブロックサイズおよびブロック形状(block shape)の少なくとも1つに基づいて変換設定グループ(transform configuration group)を構成し、1つの変換設定グループは、1つまたは複数の変換の組合せで構成され、1つの変換組合せは、全ての行(row)および列(column)に対応する変換で構成されるとともに、各行(row)または列(column)に対応する変換は、相異なるように構成される方法を提供する。
また、本発明は、DST7またはDST4などの1つの変換と、それから変形された変換に基づいて全ての行(row)および列(column)に対する変換と、を構成する方法を提供する。
また、本発明は、全ての三角変換(trigonometric transforms)(8つのDCT、8つのDST)間に存在する線形関係を利用するか、変換入出力部分に前後処理過程を追加する方式により、全ての変換に対してそれぞれ導出可能な変換集合を構成することができ、このように導出した変換集合の和集合を求めて変換組合せを決定するのに活用する方法を提供する。
これに関する具体的な実施形態は、本明細書においてより詳細に説明する。
量子化部130は、変換係数を量子化してエントロピエンコード部190に送信し、エントロピエンコード部190は、量子化された信号(quantized signal)をエントロピコーディングしてビットストリームに出力する。
上記変換部120および上記量子化部130は、別個の機能ユニットとして説明されるが、本発明はこれに限定されず、1つの機能ユニットに結合されてもよい。上記逆量子化部140および上記逆変換部150の場合も、同様に1つの機能ユニットに結合されてもよい。
量子化部130から出力された量子化された信号(quantized signal)は、予測信号を生成するために利用されることができる。例えば、量子化された信号(quantized signal)は、ループ内の逆量子化部140および逆変換部150により逆量子化および逆変換を適用することにより残差信号を復元することができる。復元された残差(残余)信号をインター予測部180またはイントラ予測部185から出力された予測信号(prediction signal)に足すことにより、復元信号(reconstructed signal)が生成される。
一方、前述したような圧縮過程で発生した量子化エラーによりブロック境界が見える劣化が発生する可能性がある。このような現象をブロックアーチファクト(ブロッキング劣化)(blocking artifacts)といい、これは、画質を評価する重要な要素の1つである。このような劣化を減らすためにフィルタリング過程を行うことができる。このようなフィルタリング過程によりブロックアーチファクトを除去するとともに、現ピクチャに対する誤差を減らすことにより画質を向上させることができる。
フィルタリング部160は、復元信号にフィルタリングを適用してこれを再生装置に出力するか、復号ピクチャバッファ170に送信する。復号ピクチャバッファ170に送信されたフィルタリングされた信号は、インター予測部180において参照ピクチャとして使用されることができる。このように、フィルタリングされたピクチャを画面間予測モードにおいて参照ピクチャとして利用することにより、画質だけでなく符号化効率も向上させることができる。
復号ピクチャバッファ170は、フィルタリングされたピクチャをインター予測部180における参照ピクチャとして使用するために記憶する。
インター予測部180は、復元ピクチャ(reconstructed picture)を参照して時間的冗長性および/または空間的冗長性を除去するために、時間予測および/または空間予測を行う。ここで、予測を行うために用いられる参照ピクチャは、以前の時間に符号化/復号の時にブロック単位で量子化および逆量子化を経た変換された信号であるため、ブロックアーチファクトやリングアーチファクト(ringing artifact)が存在し得る。
したがって、インター予測部180は、このような信号の不連続や量子化による性能低下を解決するために、ローパスフィルタ(lowpass filter)を適用することにより、ピクセル間の信号をサブピクセル単位で補間することができる。ここで、サブピクセルは、補間フィルタを適用して生成された仮想のピクセルを意味し、整数ピクセルは、復元されたピクチャに存在する実際のピクセルを意味する。補間方法としては、線形補間、双線形補間(bi-linear interpolation)、ウィナーフィルタ(wiener filter)などが適用されてもよい。
補間フィルタは、復元ピクチャ(reconstructed picture)に適用されて予測の精密度を向上させる。例えば、インター予測部180は、整数ピクセルに補間フィルタを適用して補間ピクセルを生成し、補間ピクセル(interpolated pixels)で構成された補間ブロック(interpolated block)を予測ブロック(prediction block)として使用して予測を行うことができる。
一方、イントラ予測部185は、現在符号化を行おうとするブロックの周辺にあるサンプルを参照して現ブロックを予測することができる。上記イントラ予測部185は、イントラ予測を行うために次のような過程を行う。まず、予測信号を生成するために必要な参照サンプルを用意する。そして、用意された参照サンプルを利用して予測信号を生成する。以後、予測モードを符号化する。ここで、参照サンプルは、参照サンプルパディングおよび/または参照サンプルフィルタリングにより用意される。参照サンプルは、予測および復元過程を経ているため、量子化エラーが存在する可能性がある。したがって、このようなエラーを減らすために、イントラ予測に用いられる各予測モードに対して参照サンプルフィルタリングの過程が行われる。
上記インター予測部180または上記イントラ予測部185により生成された予測信号(prediction signal)は、復元信号を生成するために利用されるか、残差信号を生成するために利用される。
図2は、本発明が適用される実施形態として、ビデオ信号のデコード(復号)が行われるデコーダの概略ブロック図を示す。
図2に示すように、デコーダ200は、パージング部(図示せず)、エントロピデコード部210、逆量子化部220、逆変換部230、フィルタリング部240、復号ピクチャバッファ(DPB:Decoded Picture Buffer unit)250、インター予測部260およびイントラ予測部265を含んで構成される。
そして、デコーダ200を介して出力された復元ビデオ信号(reconstructed video signal)は、再生装置により再生される。
デコーダ200は、図1のエンコーダ100から出力された信号を受信し、受信した信号は、エントロピデコード部210によりエントロピデコードされる。
逆量子化部220においては、量子化ステップサイズ情報を利用してエントロピデコードされた信号から変換係数(transform coefficient)を取得する。
逆変換部230においては、変換係数を逆変換して残差信号(residual signal)を取得する。
ここで、本発明は、予測モード、ブロックサイズおよびブロック形状(block shape)の少なくとも1つにより区分される変換設定グループ(transform configuration group)別に変換組合せ(transform combination)を構成する方法を提供し、上記逆変換部230は、本発明により構成された変換組合せに基づいて逆変換を行うことができる。また、本明細書において説明した実施形態が適用されることができる。
上記逆量子化部220と上記逆変換部230とは、別個の機能ユニットとして説明されるが、本発明はこれに限定されず、1つの機能ユニットに結合されてもよい。
取得された残差信号をインター予測部260またはイントラ予測部265から出力された予測信号(prediction signal)に足すことにより、復元信号(reconstructed signal)が生成される。
フィルタリング部240は、復元信号(reconstructed signal)にフィルタリングを適用してこれを再生装置に出力するか、復号ピクチャバッファ部250に送信する。復号ピクチャバッファ部250に送信されたフィルタリングされた信号は、インター予測部260において参照ピクチャとして使用可能である。
本明細書において、エンコーダ100の変換部120および各機能ユニットにおいて説明された実施形態は、それぞれデコーダの逆変換部230および対応する機能ユニットにも同様に適用されることができる。
図3は、本発明が適用されることができる実施形態として、図3Aは、QT(QuadTree、以下「QT」という)、図3Bは、BT(Binary Tree、以下「BT」という)、図3Cは、TT(Ternary Tree、以下「TT」という)、図3Dは、AT(Asymmetric Tree、以下「AT」という)によるブロック分割構造を説明する図である。
ビデオコーディングにおいて1つのブロックは、QT(QuadTree)ベースに分割されることができる。また、QTにより分割された1つのサブブロック(sub block)は、QTを使用して再帰的にさらに分割されることができる。これ以上QT分割されないリーフブロック(leaf block)は、BT(Binary Tree)、TT(Ternary Tree)およびAT(Asymmetric Tree)の少なくとも1つの方式により分割されることができる。BTは、horizontal BT(2N×N、2N×N)およびvertical BT(N×2N、N×2N)の2つの形態の分割を有する。TTは、horizontal TT(2N×1/2N、2N×N、2N×1/2N)およびvertical TT(1/2N×2N、N×2N、1/2N×2N)の2つの形態の分割を有する。ATは、horizontal-up AT(2Nx1/2N、2Nx3/2N)、horizontal-down AT(2N×3/2N、2N×1/2N)、vertical-left AT(1/2N×2N、3/2N×2N)、vertical-right AT(3/2N×2N、1/2N×2N)の4つの形態の分割を有する。それぞれのBT、TT、ATは、BT、TT、ATを使用して再帰的にさらに分割されることができる。
図3Aは、QT分割の例を示す。ブロックAは、QTにより4つのサブブロック(A0、A1、A2、A3)に分割される。サブブロックA1は、QTにより4つのサブブロック(B0、B1、B2、B3)にさらに分割される。
図3Bは、BT分割の例を示す。QTによりこれ以上分割されないブロックB3は、vertical BT(C0、C1)またはhorizontal BT(D0、D1)により分割される。ブロックC0のように、それぞれのサブブロックは、horizontal BT(E0、E1)またはvertical BT(F0、F1)の形態のように再帰的にさらに分割されることができる。
図3Cは、TT分割の例を示す。QTによりこれ以上分割されないブロックB3は、vertical TT(C0、C1、C2)またはhorizontal TT(D0、D1、D2)により分割される。ブロックC1のように、それぞれのサブブロックは、horizontal TT(E0、E1、E2)またはvertical TT(F0、F1、F2)の形態のように再帰的にさらに分割されることができる。
図3Dは、AT分割の例を示す。QTによりこれ以上分割されないブロックB3は、vertical AT(C0、C1)またはhorizontal AT(D0、D1)により分割される。ブロックC1のように、それぞれのサブブロックは、horizontal AT(E0、E1)またはvertical TT(F0、F1)の形態のように再帰的にさらに分割されることができる。
一方、BT、TT、AT分割は、共に使用して分割可能である。例えば、BTにより分割されたサブブロックは、TTまたはATによる分割が可能である。また、TTにより分割されたサブブロックは、BTまたはATによる分割が可能である。ATにより分割されたサブブロックは、BTまたはTTによる分割が可能である。例えば、horizontal BT分割の後、それぞれのサブブロックがvertical BTにより分割されることができ、またはvertical BT分割の後、それぞれのサブブロックがhorizontal BTにより分割されることができる。上記2種類の分割方法は、分割順序は異なるが、最終的に分割される形状は同一である。
また、ブロックが分割されると、ブロックを探索する順序を多様に定義することができる。一般に、左側から右側へ、上段から下段へ探索を行い、ブロックを探索するということは、各分割されたサブブロックの追加的なブロック分割を行うか否かを決定する順序を意味するか、ブロックがこれ以上分割されない場合、各サブブロックの符号化順序を意味するか、またはサブブロックにおいて他の隣接ブロックの情報を参照するときの探索順序を意味する。
図4および図5は、本発明が適用される実施形態として、図4は、エンコーダ内の変換および量子化部120/130、逆量子化および逆変換部140/150の概略ブロック図を示し、図5は、デコーダ内の逆量子化および逆変換部220/230の概略ブロック図を示す。
図4に示すように、変換および量子化部120/130は、1次変換部(primary transform unit)121、2次変換部(secondary transform unit)122および量子化部130を含む。逆量子化および逆変換部140/150は、逆量子化部140、逆2次変換部(inverse secondary transform unit)151および逆1次変換部(inverse primary transform unit)152を含む。
図5に示すように、逆量子化および逆変換部220/230は、逆量子化部220、逆2次変換部(inverse secondary transform unit)231および逆1次変換部(inverse primary transform unit)232を含む。
本発明において、変換を行うときに複数の段階を経て変換を行うことができる。例えば、図4のように、1次変換(primary transform)、2次変換(secondary transform)の2段階を適用することができ、またはアルゴリズムによってそれ以上の変換段階が利用されることもできる。ここで、上記1次変換(primary transform)は、主要変換(core transform)ということもできる。
上記1次変換部(primary transform unit)121は、残差信号に対して1次変換(primary transform)を適用し、ここで、上記1次変換(primary transform)は、エンコーダおよび/またはデコーダにおいてテーブルとして予め(既に)定義されることができる。
上記1次変換(primary transform)の場合、Discrete Cosine transform type 2(以下、「DCT2」という)が適用されることができる。あるいは、特定の場合に限定して、Discrete Sine Transform-type 7(以下、「DST7」という。)が適用されることもできる。例えば、イントラ予測モードにおいて4×4ブロックに対してDST7が適用されることができる。
また、上記1次変換(primary transform)の場合、AMT(Adaptive Multiple Transforms)の様々な変換(DST7、DCT8、DST1、DCT5)の組合せが適用されることもできる。例えば、図6が適用されることもできる。
上記2次変換部(secondary transform unit)122は、1次変換された信号に対して2次変換(secondary transform)を適用し、ここで、上記2次変換(secondary transform)は、エンコーダおよび/またはデコーダにおいてテーブルとして予め定義されることができる。
一実施形態として、上記2次変換(secondary transform)は、Non-Separable Secondary Transform(以下、「NSST」という)が条件的に適用されることができる。例えば、上記NSSTは、イントラ予測ブロックである場合にのみ適用され、予測モードグループごとに適用可能な変換セットを有することができる。
ここで、上記予測モードグループは、予測方向に対する対称性に基づいて設定される。例えば、予測モード52と予測モード16とは、予測モード34(対角方向)を基準に対称であるので、1つのグループを形成して同一の変換セット(transform set)が適用されることができる。ここで、上記予測モード52に対する変換を適用するとき、入力データをトランスポーズ(転置)(transpose)した後に適用し、これは、予測モード16と変換セットとが同一であるためである。
一方、プラナーモード(Planar mode)およびDCモード(DC mode)の場合、方向に対する対称性が存在しないので、それぞれの変換セットを有し、該当変換セットは、2つの変換で構成される。残りの方向性モードに対しては、変換セットごとに3つの変換で構成される。
他の実施形態として、上記NSSTは、1次変換されたブロック全体に対して適用されるのではなく、左上側(top-left)の8×8の領域に対してのみ適用されることができる。例えば、ブロックのサイズが8×8以上である場合は、8×8のNSSTが適用され、8×8未満である場合は、4×4のNSSTが適用されるが、ここで、4×4ブロックに分けた後、それぞれ4×4のNSSTが適用される。
上記量子化部130は、2次変換された信号に対して量子化を行う。
上記逆量子化および逆変換部140/150は、前述した過程を逆に行い、重複される説明は省略する。
図5は、デコーダ内の逆量子化および逆変換部220/230の概略ブロック図を示す。
図5に示すように、逆量子化および逆変換部220/230は、逆量子化部220、逆2次変換部(inverse secondary transform unit)231および逆1次変換部(inverse primary transform unit)232を含む。
上記逆量子化部220は、量子化ステップサイズ情報を利用してエントロピデコードされた信号から変換係数(transform coefficient)を取得する。
上記逆2次変換部(inverse secondary transform unit)231は、上記変換係数に対して逆2次変換を行う。ここで、上記逆2次変換は、図4で説明した上記2次変換(secondary transform)の逆変換を示す。
上記逆1次変換部(inverse primary transform unit)232は、逆2次変換された信号(または、ブロック)に対して逆1次変換を行い、残差信号(residual signal)を取得する。ここで、上記逆1次変換は、図4で説明した上記1次変換(primary transform)の逆変換を示す。
本発明は、予測モード、ブロックサイズおよびブロック形状(block shape)の少なくとも1つにより区分される変換設定グループ(transform configuration group)別に変換組合せ(transform combination)を構成する方法を提供し、上記逆1次変換部(inverse primary transform unit)232は、本発明により構成された変換組合せに基づいて逆変換を行う。また、本明細書で説明した実施形態が適用されることができる。
図6は、本発明が適用される実施形態として、AMT(Adaptive Multiple Transforms)が適用される変換設定グループ(transform configuration group)を示す表である。
AMT(Adaptive Multiple Transforms)が適用される変換設定グループ
本明細書では、変換設定グループGiに対するj番目の変換組合せ候補を次の数式1のようにペアで表示する。
<数式1>
Figure 0007446988000001
ここで、H(Gi,j)は、j番目の候補に対する水平変換(horizontal transform)を示し、V(Gi,j)は、j番目の候補に対する垂直変換(vertical transform)を示す。例えば、図6においてH(G3,2)=DST7、V(G3,2)=DCT8のように表記することができる。コンテキスト(文脈、状況)によってH(Gi,j)またはV(Gi,j)に割り当てられる値は、上記の例のように変換を区分するための表示上の値(nominal value)であってもよく、当該変換を示すインデックス値であってもよく、該当変換に対する2D(二次元)行列(2 Dimensional matrix)であってもよい。
また、本明細書において、DCTおよびDSTに対する2Dの行列値を次の数式2ないし3のように表記することができる。
<数式2>
Figure 0007446988000002
<数式3>
Figure 0007446988000003
ここで、DSTまたはDCTであるか否かは、SまたはCにより示し、typeの数字は、ローマ数字の形態で上付き文字により表記し、下付き文字のNは、N×N変換であることを示す。また、上記
Figure 0007446988000004
および
Figure 0007446988000005
のような2D行列は、列ベクトル(column vector)が変換基底(transform basis)をなすことを仮定する。
図6に示すように、変換設定グループ(transform configuration group)は、予測モードに基づいて決定され、グループの数は、計6つ(G0~G5)であり得る。そして、G0~G4は、イントラ予測が適用される場合に該当し、G5は、インター予測により生成された残差(residual)ブロックに適用される変換組合せ(または、変換セット、変換組合せセット)を示す。
1つの変換組合せは、当該2Dブロックの行(row)に適用される水平変換(horizontal transform)(または、行変換(row transform))と列(column)に適用される垂直変換(vertical transform)(または、列変換(column transform))とからなる。
ここで、全ての変換設定グループは、各4つの変換組合せ候補を有することができる。上記4つの変換組合せ候補は、0~3の変換組合せインデックスにより選択または決定され、エンコーダからデコーダに、上記変換組合せインデックスをエンコードして送信することができる。
一実施形態として、イントラ予測により取得した残差データ(または、残差信号)は、イントラ予測モードによってその統計的特性がそれぞれ異なることがある。したがって、図6のように、イントラ予測モード別に一般的なコサイン変換ではない他の変換を適用することができる。
図6を見ると、35個のイントラ予測モードを使用する場合と67個のイントラ予測モードを使用する場合とを示す。各イントラ予測モード列において区分された変換設定グループ別に複数の変換組合せが適用されることができる。例えば、上記複数の変換組合せは、4つの(行方向変換、列方向変換)組合せで構成される。具体的な例として、グループ0においては、行(水平)方向および列(垂直)方向の両方にDST-7およびDCT-5が適用されることができるため、計4つの組合せが可能である。
各イントラ予測モードに対して、計4つの変換カーネル組合せが適用されることができるので、そのうちの1つを選択するための変換組合せインデックスが変換単位(transform unit)ごとに送信されることができる。本明細書において、上記変換組合せインデックスは、AMTインデックス(AMT index)と呼ぶことができ、amt_idxと表現できる。
また、図6において提示した変換カーネル以外にも、残差信号(residual signal)の特性上、行方向および列方向の両方に対してDCT-2が最適である場合が発生し得る。したがって、コーディングユニット(Coding Unit)ごとにAMTフラグを定義することにより適応的に変換を行うことができる。ここで、AMTフラグが0である場合、行方向および列方向の両方に対してDCT-2を適用し、AMTフラグが1である場合、AMTインデックスにより4つの組み合せのうちの1つを選択または決定する。
一実施形態として、AMTフラグが1である場合、1つの変換単位に対して0でない変換係数の個数が閾値より大きくなければ、図6の変換カーネルを適用せずに行方向および列方向の両方に対してDST-7を適用することができる。例えば、上記閾値は、2に設定されることができ、これは、ブロックサイズまたは変換ユニットのサイズに基づいて異なるように設定されることができる。これは、明細書の他の実施形態にも適用可能である。
一実施形態として、変換係数値を先にパージングして0でない変換係数の個数が閾値より大きくない場合、AMTインデックスをパージングせずにDST-7を適用することにより付加情報の送信量を減らすことができる。
一実施形態として、AMTフラグが1である場合、1つの変換単位に対して0でない変換係数の個数が閾値より大きければ、AMTインデックスをパージングし、AMTインデックスに基づいて水平変換および垂直変換を決定することができる。
一実施形態として、AMTは、変換単位の幅および高さが両方とも32以下である場合にのみ適用されることができる。
一実施形態として、図6は、オフライントレーニング(off-line training)により予め設定されることができる。
一実施形態として、上記AMTインデックスは、水平変換と垂直変換との組合せを同時に示し得る1つのインデックスとして定義されることができる。あるいは、上記AMTインデックスは、水平変換インデックスと垂直変換インデックスとを別途に定義することもできる。
一実施形態として、上記AMTフラグまたは上記AMTインデックスは、シーケンス、ピクチャ、スライス、ブロック、コーディングユニット、変換ユニット、および予測ユニットの少なくとも1つのレベルにおいて定義されることができる。例えば、上記AMTフラグまたは上記AMTインデックスは、SPS(Sequence Parameter Set)および変換ユニットの少なくとも1つのレベルにおいて定義されることができる。
実施形態(1):DCT8をDST7の変形した形態に代替する方法
Figure 0007446988000006
は、次の数式4の関係式を満たす。
<数式4>
Figure 0007446988000007
上記数式4において、
Figure 0007446988000008
は、逆対角線にのみ1の値を有する行列であり、
Figure 0007446988000009
は、対角線にのみ1と-1が交互に登場する行列である。
次の数式5は、N×1入力ベクトル
Figure 0007446988000010
に対してDCT8の順方向変換(forward transform)
Figure 0007446988000011
を適用して、N×1変換係数ベクトル
Figure 0007446988000012
を求める過程を示す。
<数式5>
Figure 0007446988000013
ここで、添字Aは、alternateの略語として符号が交互に変わることを示し、添字Rは、ベクトルの順序が変わることを意味し、添字ARは、2つとも適用されることを意味する。
上記数式4を適用して上記数式5のように展開すると、
Figure 0007446988000014
を成す変換基底ベクトルのみを利用して
Figure 0007446988000015
に対する変換を適用できるので、コーデック内部において
Figure 0007446988000016
を記憶するための別途のメモリ空間が不要となる。
上記数式5のように、
Figure 0007446988000017
に対する順方向変換(forward transform)を適用するときは、
Figure 0007446988000018
を求めて
Figure 0007446988000019
を乗じてもよく、または、
Figure 0007446988000020
をそのままにして
Figure 0007446988000021
を乗じてもよい。また、
Figure 0007446988000022
および
Figure 0007446988000023
を適用するときは、
Figure 0007446988000024
を成す基底ベクトル自体に符号反転(sign inversion)を適用するのではなく、次の数式6のように、各基底ベクトルおよび
Figure 0007446988000025
に対する内積を求めるとき、
Figure 0007446988000026
に符号反転(sign inversion)を適用して内積を求めてもよい。
<数式6>
Figure 0007446988000027
上記数式5および6は、
Figure 0007446988000028

Figure 0007446988000029
のカーネル係数データとして表現して
Figure 0007446988000030
を記憶するために必要なメモリをなくす方法を提示する。これに加えて、上記数式4の関係式をそのまま適用するのではなく、次の数式7のように
Figure 0007446988000031
の代わりに
Figure 0007446988000032
を使用するように構成することができる。
<数式7>
Figure 0007446988000033
ここで、
Figure 0007446988000034
は、flipped DST7を示す。上記数式7のように
Figure 0007446988000035
を使用すると、
Figure 0007446988000036
の代わりに
Figure 0007446988000037
に対して
Figure 0007446988000038
を適用することと同様になり、上記数式5および6のように交互に符号反転(sign inversion)を適用する必要がない。上記数式5に対応する逆方向変換(backward (inverse) transform)の適用方法は、数式8と同一であり、上記数式7に対応する逆方向変換(backward (inverse) transform)の適用方法は、数式9と同一である。
<数式8>
Figure 0007446988000039
<数式9>
Figure 0007446988000040
実施形態(2):DST7をDST4に代替し、DCT8をDST4の変形した形態に代替する方法
本発明の一実施形態として、DST7の代わりにDST4を使用する方法を提案する。次の数式10のように、DST4とDCT4との間にもDST7とDCT8との間と同一の関係式が成立する。
<数式10>
Figure 0007446988000041
したがって、DST7の代わりにDST4を使用する場合、DCT8の代わりにDCT4を使用することになると、上記数式10を利用してDCT4をDST4で表現することができるため、DCT4を記憶するための別途のメモリ空間が不必要になる。上記数式5と同一の方法でDCT4に対する順方向変換(forward transform)を適用する方法を記述すると、次の数式11の通りである。
<数式11>
Figure 0007446988000042
次の数式12においては、上記数式6と同様の方式で
Figure 0007446988000043
に対する符号反転(sign inversion)を適切に取って
Figure 0007446988000044
のカーネル係数データに対するいかなる修正もせずに上記数式11と同一の結果を得ることができる。
<数式12>
Figure 0007446988000045
また、次の数式13のように上記数式7と同一の方法で
Figure 0007446988000046
の代わりに
Figure 0007446988000047
を使用して符号反転(sign inversion)をなくすことができる。
<数式13>
Figure 0007446988000048
上記数式11に対応する逆方向変換(backward (inverse) transform)の適用方法は、次の数式14と同一であり、上記数式13に対応する逆方向変換(backward (inverse) transform)の適用方法は、次の数式15と同一である。
<数式14>
Figure 0007446988000049
<数式15>
Figure 0007446988000050
図7は、本発明が適用される実施形態として、AMT(Adaptive Multiple Transforms)が行われるエンコード過程を示すフローチャートである。
本明細書においては、基本的に水平方向と垂直方向とに対して分離して変換を適用する実施形態を説明しているが、変換組合せは非分離変換(non-separable transform)で構成することも可能である。
あるいは、可分離変換(分離可能な変換)(separable transform)と非分離変換(non-separable transform)との混合で構成することもできる。この場合、非分離変換(non-separable transform)が利用されると、行/列(row/column)別の変換選択や水平/垂直(horizontal/vertical)方向別の選択は不要となり、可分離変換(separable transform)が選択される場合にのみ図6の変換組合せが利用されることができる。
また、本明細書で提案する方式は、1次変換(primary transform)や2次変換(secondary transform)に関係なく適用することができる。すなわち、いずれか一方にのみ適用されなければならないという制約はなく、両方とも適用されることもできる。ここで、上記1次変換(primary transform)は、残差(residual)ブロックを最初に変換するための変換を意味し、上記2次変換(secondary transform)は、上記1次変換の結果として生成されたブロックに対して変換を適用するための変換を意味する。
まず、エンコーダは、現ブロックに対応する変換設定グループを決定する(S710)。ここで、上記変換設定グループは、図6の変換設定グループを意味し得るが、本発明はこれに限定されず、他の変換組合せで構成されることもできる。
上記エンコーダは、上記変換設定グループ内の利用可能な候補変換組合せに対して変換を行う(S720)。
上記変換の実行の結果、上記エンコーダは、RD(Rate Distortion)コスト(費用)が最も小さい変換組合せを決定または選択する(S730)。
上記エンコーダは、上記選択された変換組合せに対応する変換組合せインデックスをエンコードする(S740)。
図8は、本発明が適用される実施形態として、AMT(Adaptive Multiple Transforms)が行われるデコード過程を示すフローチャートである。
まず、デコーダは、現ブロックのための変換設定グループを決定する(S810)。
上記デコーダは、ビデオ信号から変換組合せインデックスをパージング(または、取得)し、ここで、上記変換組合せインデックスは、上記変換設定グループ内の複数の変換組合せのいずれか1つに対応する(S820)。例えば、上記変換設定グループは、DST7(Discrete Sine Transform type 7)およびDCT8(Discrete Cosine Transform type 8)を含むことができる。上記変換組合せインデックスは、AMTインデックスと言ってもよい。
一実施形態として、上記変換設定グループは、現ブロックの予測モード、ブロックサイズおよびブロック形式の少なくとも1つに基づいて設定される。
上記デコーダは、上記変換組合せインデックスに対応する変換組合せを導出する(S830)。ここで、上記変換組合せは、水平変換および垂直変換で構成され、上記DST-7およびDCT-8の少なくとも1つを含むことができる。
また、上記変換組合せは、図6で説明した変換組合せを意味し得るが、本発明は、これに限定されない。すなわち、本明細書内の他の実施形態による他の変換組合せによる構成も可能である。
上記デコーダは、上記変換組合せに基づいて上記現ブロックに対して逆変換を行う(S840)。上記変換組合せが行(水平)変換および列(垂直)変換で構成された場合、行(水平)変換を先に適用した後、列(垂直)変換を適用することができる。ただし、本発明はこれに限定されず、逆に適用されるか、または非分離変換で構成される場合には、すぐに非分離変換が適用されることもできる。
一実施形態として、上記垂直変換または上記水平変換が上記DST-7またはDCT-8である場合、上記DST-7の逆変換またはDCT-8の逆変換を列ごとに適用した後、行ごとに適用することができる。
一実施形態として、上記垂直変換または上記水平変換は、各行ごとにおよび/または各列ごとに異なる変換が適用されることができる。
一実施形態として、上記変換組合せインデックスは、AMTが行われるか否かを示すAMTフラグに基づいて取得できる。すなわち、上記変換組合せインデックスは、上記AMTフラグによってAMTが行われる場合に取得できる。
一実施形態として、上記デコーダは、0でない変換係数の個数が閾値より大きいか否かを確認する。ここで、上記変換組合せインデックスは、上記0でない変換係数の個数が閾値より大きい場合に取得される。
一実施形態として、上記AMTフラグまたは上記AMTインデックスは、シーケンス、ピクチャ、スライス、ブロック、コーディングユニット、変換ユニット、および予測ユニットの少なくとも1つのレベルにおいて定義されることができる。
一実施形態として、上記逆変換は、変換単位の幅および高さが両方とも32以下である場合にのみ適用されることができる。
一方、他の実施形態として、変換設定グループを決定する過程と変換組合せインデックスをパージングする過程とは同時に実行されてもよい。あるいは、上記S810ステップは、エンコーダおよび/またはデコーダにおいて予め設定されて省略されることもできる。
図9は、本発明が適用される実施形態として、AMTフラグおよびAMTインデックスをエンコードする過程を説明するためのフローチャートである。
エンコーダは、現ブロックに対してAMT(Adaptive Multiple Transforms)が適用されるか否かを決定する(S910)。
AMT(Adaptive Multiple Transforms)が適用される場合、上記エンコーダは、AMTフラグ=1でエンコードする(S920)。
そして、上記エンコーダは、上記現ブロックの予測モード、水平変換、垂直変換の少なくとも1つに基づいてAMTインデックスを決定する(S930)。ここで、AMTインデックスは、各イントラ予測モードに対して複数の変換組合せのいずれか1つを示すインデックスを意味し、上記AMTインデックスは、変換単位(transform unit)ごとに送信されることができる。
上記AMTインデックスが決定されると、上記エンコーダは、上記AMTインデックスをエンコードする(S940)。
一方、上記AMT(Adaptive Multiple Transforms)が適用されない場合、上記エンコーダは、AMTフラグ=0でエンコードする(S950)。
図10は、本発明が適用される実施形態として、AMTフラグおよびAMTインデックスに基づいて水平変換または垂直変換を行または列に適用するデコード過程を説明するためのフローチャートである。
デコーダは、ビットストリームからAMTフラグをパージングする(S1010)。ここで、AMTフラグは、現ブロックに対してAMT(Adaptive Multiple Transforms)が適用されるか否かを示す。
上記デコーダは、上記AMTフラグに基づいて現ブロックに対してAMT(Adaptive Multiple Transforms)が適用されるか否かを確認する(S1020)。例えば、上記AMTフラグが1である否かを確認する。
上記AMTフラグが1である場合、上記デコーダは、0でない変換係数の個数が閾値より大きいか(または、閾値以上であるか)否かを確認する(S1030)。例えば、上記閾値は2に設定されることができ、これは、ブロックサイズまたは変換ユニットのサイズに基づいて異なるように設定されることができる。
上記0でない変換係数の個数が閾値より大きい場合、上記デコーダは、AMTインデックスをパージングする(S1040)。ここで、上記AMTインデックスは、各イントラ予測モードまたはインター予測モードに対して複数の変換組合せのいずれか1つを示すインデックスを意味し、上記AMTインデックスは、変換単位(transform unit)ごとに送信されることができる。あるいは、上記AMTインデックスは、予め設定された変換組合せのテーブルに定義されたいずれか1つの変換組合せを示すインデックスを意味し、ここで、上記予め設定された変換組合せテーブルは、図6を意味し得るが、本発明はこれに限定されない。
上記デコーダは、上記AMTインデックスおよび予測モードの少なくとも1つに基づいて水平変換および垂直変換を導出または決定する(S1050)。
あるいは、上記デコーダは、上記AMTインデックスに対応する変換組合せを導出する。例えば、上記デコーダは、上記AMTインデックスに対応する水平変換および垂直変換を導出または決定することができる。
一方、上記0でない変換係数の個数が閾値より大きくない場合、上記デコーダは、予め設定された垂直逆変換を列ごとに適用する(S1060)。例えば、上記垂直逆変換は、DST7の逆変換であり得る。
そして、上記デコーダは、予め設定された水平逆変換を行ごとに適用する(S1070)。例えば、上記水平逆変換は、DST7の逆変換であり得る。すなわち、上記0でない変換係数の個数が閾値より大きくない場合は、エンコーダまたはデコーダにおいて予め設定された変換カーネルが利用されることができる。例えば、図6のような変換組合せのテーブルにおいて定義されたものではなく、多く利用される変換カーネルが利用されることができる。
一方、上記AMTフラグが0である場合、上記デコーダは、予め設定された垂直逆変換を列ごとに適用する(S1080)。例えば、上記垂直逆変換は、DCT-2の逆変換であり得る。
そして、上記デコーダは、予め設定された水平逆変換を行ごとに適用する(S1090)。例えば、上記水平逆変換は、DCT-2の逆変換であり得る。すなわち、AMTフラグが0である場合は、エンコーダまたはデコーダにおいて予め設定された変換カーネルが利用されることができる。例えば、図6のような変換組合せのテーブルにおいて定義されたものではなく、多く利用される変換カーネルが利用されることができる。
図11は、本発明が適用される実施形態として、変換組合せの各行(row)または列(column)に対応する変換を相異なるように構成する方法を説明する図である。
実施形態(3):変換組合せの各行(row)または列(column)に対応する変換を相異なるように構成する方法
本発明の一実施形態として、M×Nの2Dブロック(2 Dimensional block)に対して、水平(行)方向にはN×N変換が適用され、垂直(列)方向にはM×M変換が適用される。
他の一実施形態として、図11のM個の行(rows)に対してそれぞれ異なる変換が適用されてもよく、N個の列(columns)に対してもそれぞれ異なる変換を適用されてもよい。適用される全ての水平(行)変換(horizontal (row) transforms)および垂直(列)変換(vertical (column) transforms)を記号で表記すると、次の数式16の通りである。
<数式16>
Figure 0007446988000051
上記
Figure 0007446988000052
および
Figure 0007446988000053
は、それぞれある指定された変換セット(transform set)に属する要素になり得る。例えば、次のように、
Figure 0007446988000054
のための変換セット(transform set)である
Figure 0007446988000055
と、
Figure 0007446988000056
のための変換セット(transform set)である
Figure 0007446988000057
と、が存在すると、次の数式17および数式18のように表現できる。
<数式17>
Figure 0007446988000058
<数式18>
Figure 0007446988000059
ここで、
Figure 0007446988000060
および
Figure 0007446988000061
が成立し、
Figure 0007446988000062
および
Figure 0007446988000063
は互いに重複し得る。すなわち、同一の変換を有することができる。
全ての
Figure 0007446988000064
が同一の変換であり、
Figure 0007446988000065
も同一の変換である場合は、通常の2D可分離変換(separable transform)になる。M=Nである場合に
Figure 0007446988000066

Figure 0007446988000067
とは、共通元素を有し得る。すなわち、空集合ではない共通集合を有することができる。
Figure 0007446988000068
および
Figure 0007446988000069
の例を列挙してみると、次の数式19ないし21の通りである。便宜上、本明細書では、これから
Figure 0007446988000070

Figure 0007446988000071
とをあわせて
Figure 0007446988000072
と表記し、適用される方向(horizontalまたはvertical)や変換サイズ(M×MまたはN×N)は、コンテキストによって把握できると仮定する。
<数式19>
Figure 0007446988000073
<数式20>
Figure 0007446988000074
<数式21>
Figure 0007446988000075
図6のように変換設定グループによって相異なる
Figure 0007446988000076
を有することができる。また、変換設定グループだけでなく、2Dブロックの各辺の長さによっても異なる
Figure 0007446988000077
を有することができ、ブロック形状(block shape)によっても異なる
Figure 0007446988000078
を有するように構成することができる。
上記数式21においては、変換サイズが指定されていないが(・と表記)、これは、変換を選択(または、決定)するにおいてサイズを考慮しないか、または変換が適用される状況によって適当なサイズを適応的に選択することを意味する。例えば、
Figure 0007446988000079
が選択されたとすると、長さが8である場合は、
Figure 0007446988000080
が適用され、長さ4である場合は、
Figure 0007446988000081
が使用されることを意味し得る。例えば、図6においてG1における水平変換(horizontal transform)に対する
Figure 0007446988000082
は、
Figure 0007446988000083
になる。
図12は、本発明が適用される実施形態として、予測モード、ブロックサイズおよびブロック形状(block shape)の少なくとも1つに基づいて変換設定グループ(transform configuration group)を構成する一般的な方法を説明する図である。
図6において前述したように、変換設定グループ(transform configuration group)Giに対するj番目の変換組合せ候補を(H(Gi,j)、V(Gi,j))のように表記した。ここで、H(Gi,j)およびV(Gi,j)は、それぞれ適用される水平変換(horizontal transform)および垂直変換(vertical transform)を示す。
図6において、各候補の水平変換(horizontal transform)および垂直変換(vertical transform)が単一変換(例えば、DST7、DCT5)であるので、H(Gi,j)=DST7のような方式で表記したが、全ての行(row)または列(column)に対してそれぞれ異なる変換が適用されることができる場合、H(Gi,j)およびV(Gi,j)は、次の数式22のようにそれぞれM個およびN個の元素で構成されたタプル(tuple)で表現することができる。
<数式22>
Figure 0007446988000084
上記数式22において、
Figure 0007446988000085
は、それぞれ異なる
Figure 0007446988000086
から選択されることもあり、同一の
Figure 0007446988000087
から指定されることもある。
Figure 0007446988000088
も同様である。上記数式22における表記法(notation)を活用して一般的な変換設定グループを構成するテーブルを示すと、図12の通りである。
図12の変換設定グループは、図6のように予測モードに基づいて構成されてもよく、予測モード、ブロックサイズ、ブロック形状の少なくとも1つの組合せに基づいて構成されてもよい。例えば、イントラ予測モード0(planar mode)により生成された4×8残差ブロック(residual block)に適用される変換候補を、Group 0に割り当てることができる。ここで、H(G0,j)は、4つの8×8変換で構成されたタプル(tuple)になり、V(G0,j)は、8つの4×4変換で構成されたタプル(tuple)になる。
図12のように、全ての場合を一度に区分して変換設定グループを構成することもできるが、複数のテーブルに分割して変換設定グループを組み合わせることもできる。
図13および図14は、本発明が適用される実施形態として、予測モード、ブロックサイズ、ブロック形状の少なくとも1つに基づく複数のテーブルに区分して変換設定グループを組み合わせる方法を説明する表である。
図13は、行変換(row transform)(または、水平変換(horizontal transform))を構成するグループを示し、上記図14は、列変換(column transform)(または、垂直変換(vertical transform))を構成するグループを示す。
本発明の一実施形態として、行変換(row transform)構成のためのテーブルと列変換(column transform)構成のためのテーブルとに区分する方法を提供する。
エンコーダにおいてどの変換組合せを利用するかを示す変換インデックスを送信する場合、行変換(row transform)(H(HGi,j))を指定するための行変換インデックスと列変換(column transform)(V(VGi,j))を指定するための列変換インデックスとをそれぞれシグナリングするか、または2つのインデックス情報を両方とも含んでいる1つの変換インデックスをシグナリングすることができる。
図13および図14においては、4×4の変換に対するテーブルのみを提供しているが、本発明はこれに限定されない。例えば、異なるサイズ(例えば、8×8、32×32)に対してもそれぞれ変換設定グループテーブルが定義されることができる。
16×8ブロックに変換を適用する場合、水平方向に8×8水平変換(horizontal transform)テーブルを参照し、垂直方向には16×16垂直変換(vertical transform)テーブルを参照すればよい。
図15は、本発明が適用される実施形態として、1つの変換セットを利用して、全ての変換設定グループ(transform configuration group)を構成する一例を示す。
実施形態(4):1つの変換セットを利用して変換設定グループ(transform configuration group)を構成する方法
図6の実施形態(1)において前述したように、変換セット
Figure 0007446988000089
としてDST7およびDST7の変形した形態を使用でき、全ての水平変換(horizontal transform)に対するタプル(tuple)(H(Gi,j))、垂直変換(vertical transform)に対するタプル(tuple)(V(Gi,j))に同一の
Figure 0007446988000090
を適用することができる。ここで、変換セット
Figure 0007446988000091
を構成する変換は、変換サイズ(4×4、8×8など)を区分せずに、状況に応じて当該サイズを選択するようにすることができる。関連して利用可能な変換セット
Figure 0007446988000092
を列挙してみると、次の数式23の通りである。
<数式23>
Figure 0007446988000093
ここで、上付き文字Aは、alternateの略語として符号が交互に変わることを示し、上付き文字Rは、ベクトルの順序が変わることを意味し、上付き文字ARは、2つとも適用されることを意味する。
上記数式23において、
Figure 0007446988000094
は、
Figure 0007446988000095
と同一のカーネル係数のデータを使用するため、事実上、別途のカーネル係数データの追加が不要である。
また、一般的なコーデックにおいては、DCT2を予め含んでいるので、メモリの追加なしで変換セット
Figure 0007446988000096
にDCT2を含ませることができる。DCT2が含まれた変換セット
Figure 0007446988000097
の例は、次の数式24の通りである。
<数式24>
Figure 0007446988000098
上記数式23においてまたは数式24においての変換セット
Figure 0007446988000099
を利用して変換設定グループを図6または図12のように構成することができる。
例えば、図6のように構成する場合は、1つのブロックに対して全ての行(rows)に同一の水平変換(horizontal transform)を適用し、全ての列(columns)にも同一の垂直変換(vertical transform)を適用する方式を示す。
また、図6においては、ブロック形状やサイズによってテーブルが区分されないので、指定された変換に対して当該ブロックのサイズに対応する変換を選択すればよい。図6のように構成するときは、変換カーネル係数データを記憶するために必要なメモリを減らすために、上記数式23で提示した変換セット
Figure 0007446988000100
のうちの1つを選択して全ての変換設定グループの候補を記述するか、上記数式24で提示した変換セット
Figure 0007446988000101
のうちの1つを選択して全ての変換設定グループの候補を決定することができる。
図15は、変換セット
Figure 0007446988000102
のみを使用して全ての変換設定グループの変換組合せを記述した例を示す。
以下、図16においては、変換ブロックサイズに基づいて相異なる変換セットを利用して変換設定グループ(transform configuration group)を構成する例を説明する。
図16は、本発明が適用される実施形態として、変換ブロックサイズに基づいて相異なる変換セットを利用して変換設定グループ(transform configuration group)を構成する一例を示す。
図12の方式で変換設定グループを構成する例として、図16は、4×4変換の場合は変換セット
Figure 0007446988000103
を使用し、8×8変換の場合は変換セット
Figure 0007446988000104
を使用する場合を示す。
例えば、図16のGroup 0は、プラナーモード(planar mode)およびDCモードが適用される8×4ブロックに対応する。
本発明の一実施形態として、前述した実施形態(2)のようにDST7の代わりにDST4を使用できると仮定するとき、上記数式23および24の場合と同一の方法で変換セット
Figure 0007446988000105
を設定することができる。次の数式25は、変換カーネル係数データとして
Figure 0007446988000106
のみを使用した例を示し、数式26は、
Figure 0007446988000107
および
Figure 0007446988000108
を使用した例を示す。
<数式25>
Figure 0007446988000109
<数式26>
Figure 0007446988000110
同様に、上記数式25および26で提示した変換セット
Figure 0007446988000111
を利用して、図15または図16のような変換組合せを構成することができる。ブロックサイズまたはブロック形状によって変換設定グループが変わる場合は、ブロックサイズに対応する変換セット
Figure 0007446988000112
を選択して使用すればよい。
基本的には、変換セット
Figure 0007446988000113
はいずれの変換も含むことができる。例えば、次の数式27のように、
Figure 0007446988000114
および
Figure 0007446988000115
に関連する変換を全て含めて変換セット
Figure 0007446988000116
を構成することができる。あるいは、数式28のように全ての種類のコサイン変換/サイン変換を含めて変換セット
Figure 0007446988000117
を構成することもできる。あるいは、数式29のようにトレーニング(training)データから取得されたKLT(Karhunen Loeve Transform)またはSOT(Sparse Orthonormal Transform)を含めて変換セット
Figure 0007446988000118
を構成することもできる。
<数式27>
Figure 0007446988000119
<数式28>
Figure 0007446988000120
<数式29>
Figure 0007446988000121
また、本明細書においては、基本的に水平方向と垂直方向とに対して分離して変換を適用することを仮定しているが、変換セット
Figure 0007446988000122
は、非分離変換(non-separable transform)で構成することもでき、場合によっては、可分離変換(separable transform)と非分離変換(non-separable transform)との混合で構成することもできる。
混合構成の場合、非分離変換(non-separable transform)が選択されると、行/列(row/column)別の変換選択や水平/垂直(horizontal/vertical)方向別の変換選択が不要である。可分離変換(separable transform)が選択される場合にのみ、前述した実施形態により提示した変換組合せを構成することができる。
本明細書の一実施形態は、1次変換(primary transform)や2次変換(secondary transform)に関係なく適用されることができる。すなわち、いずれか一方にのみ適用されなければならないという制約はなく、両方とも適用されることもできる。
図17は、本発明が適用される実施形態として、スパンセット(spanned set)を構成する一例を示す。
実施形態(5):スパンセット(spanned set)を構成
本明細書において適用されるコサイン変換(cosine transform)に対する数式は、次の数式30の通りである。
<数式30>
Figure 0007446988000123
ここで、
Figure 0007446988000124
は、上記値以外の場合、1の値を有する。すなわち、デフォルトとして1の値を有する。
そして、本明細書において適用されるサイン変換(sine transform)に対する数式は、次の数式31の通りである。
<数式31>
Figure 0007446988000125
ここで、
Figure 0007446988000126
は、上記値以外の場合、1の値を有する。すなわち、デフォルトとして1の値を有する。
上記コサイン変換(cosine transform)およびサイン変換(sine transform)に対する数式から、実施形態(1)および(2)により提示した
Figure 0007446988000127

Figure 0007446988000128
との関係、
Figure 0007446988000129

Figure 0007446988000130
との関係を含めて次の数式32の関係式を導出することができる。
<数式32>
Figure 0007446988000131
また、上記数式32における関係式から次の数学の式33のような関係式が導出されることができる。
<数式33>
Figure 0007446988000132
上記数式33で登場する
Figure 0007446988000133
および
Figure 0007446988000134
に対する計算は、次の数式34のように入力に対する順序反転と符号反転とのパターンを適切に組み合わせて行うことができる。
<数式34>
Figure 0007446988000135
したがって、上記数式32および33における関係式から、1つの特定変換に対するカーネル係数データのみを有しても様々な異なる変換を導出することができる。次の数式35は、1つの変換がスパン(span)できる変換を集合として表現したものである。
<数式35>
Figure 0007446988000136
上記数式35において提示した各スパンセット(span set)に対して該当のべき集合を計算することができる。例えば、
Figure 0007446988000137
に対するべき集合
Figure 0007446988000138
は、次の数式36のように表現できる。
<数式36>
Figure 0007446988000139
Aというスパンセット(span set)に対するべき集合の1つの元素を
Figure 0007446988000140
と表示すると、次の数式37のように表現することができる。
<数式37>
Figure 0007446988000141
上記、実施形態(2)および(3)において定義した変換セット
Figure 0007446988000142
を、上記数式37のように構成することができる。上記数式35におけるスパンセットに対するべき集合間には重なる元素が存在するため、上記数式37で登場する
Figure 0007446988000143
は、disjointしない可能性がある。
上記数式35のように、1つの変換が複数の変換にスパン(span)されることも可能であるので、実際のメモリ空間に係数データの形態で記憶すべき変換の数は、はるかに少ない。例えば、
Figure 0007446988000144
をスパンするためには2つの変換で十分であり、様々な組合せの1つとして
Figure 0007446988000145
が可能である。
大部分のコーデックシステムにおいては、
Figure 0007446988000146
を含み、イントラ予測から生成された残差データには、大体
Figure 0007446988000147
が効率的であると知られており、実施形態(2)のように
Figure 0007446988000148

Figure 0007446988000149
に代替できるとすると、図17のようにシード(seed)になる変換からスパン(span)できる最大の変換集合を生成することができる。
図17で提示した最大スパンセット(maximally spanned set)は、最大に使用できる変換の集合であるので、変換セット
Figure 0007446988000150
として使用するときは、図17の部分集合を使用することができる。
上記数式32および33における関係式から、
Figure 0007446988000151
および
Figure 0007446988000152
に対するスパンセット(span set)を、次の数式38のように、
Figure 0007446988000153
および
Figure 0007446988000154
により表現することができる。ここで、
Figure 0007446988000155
および
Figure 0007446988000156
は、上記数式4において定義されている。
<数式38>
Figure 0007446988000157
実施形態(1)においては、上記数式7のように
Figure 0007446988000158
の代わりに
Figure 0007446988000159
を使用する例を提示したが、これは順方向変換(forward transform)
Figure 0007446988000160
を適用したときに生成される係数の符号(sign)を反転せずに使用する効果をもたらす。同一の方式を上記数式38にも適用すると、順方向変換(forward transform)の一番前に乗じられる
N
が脱落して次の数式39のように該当スパンセット(span set)が変更される。
<数式39>
Figure 0007446988000161
したがって、上記数式35および上記図17において羅列されたスパンセット(span set)においても、各スパンセット(span set)に含まれた全ての変換を上記数式32および33における関係式を用いて、上記数式38のように
Figure 0007446988000162

Figure 0007446988000163
とシード変換(seed transform)との線形関係式で表現することができる。以後、上記数式39のように順方向変換(forward transform)を算出し、一番前の
Figure 0007446988000164
を除去すると、変換係数の符号を反転しない変換で構成されたスパンセット(span set)の導出が可能になる。このように取得されたスパンセット(span set)を利用して、上記数式37の関係式に基づいて希望する変換セット
Figure 0007446988000165
を構成することができる。
上記数式38を見ると、
Figure 0007446988000166
というシード変換(seed transform)を中心に置いて前後に
Figure 0007446988000167
および
Figure 0007446988000168
を適切に乗じて変換をスパンすることが確認できる。前に乗じられる行列は、中心のシード変換(seed transform)を適用した後に得られた出力を後処理するものと見ることができる。そして、後に乗じられる行列は、中心のシード変換(seed transform)を適用する前に入力に対して前処理を行うものと見ることができる。
Figure 0007446988000169

Figure 0007446988000170
とを多様な組合せで何度も乗じたときに出る結果は、次の数式40のように整理することができる。
<数式40>
Figure 0007446988000171
したがって、1つのシード変換(seed transform)に対して前処理および後処理の方にそれぞれ8つの場合が可能になり、両方の組合せにより64個の場合が発生する。しかしながら、前処理の方のc値と後処理の方のc値とを共に考慮すると、重なる場合が発生するので(すなわち、符号変化は、最終的に+/-の2つに帰結されるので)、場合の数は計32種類になる。変換結果の符号変化の様相のみを考慮し、符号値そのものに対して無視すると、上記数式40において、c値は1に固定できるので、場合の数の総計は、16種類になる。上記数式40を前処理および後処理に全て適用した例を見ると、次の数式41の通りである。
<数式41>
Figure 0007446988000172
上記数式41の例に対してc値を考慮しない場合に関する例を見ると、次の数式42の通りである。
<数式42>
Figure 0007446988000173
上記数式39のように順方向変換(forward transform)を適用して求めた変換係数の符号を気にしないとすると、順方向変換(forward transform)に対して入力前処理の方では、
Figure 0007446988000174

Figure 0007446988000175
との組合せをそのまま使用し、出力後処理の方では、
Figure 0007446988000176
のみを使用すればいいので、場合の数の総計は、8つに減少する。次の数式43において、該当例を見せる。
<数式43>
Figure 0007446988000177
本発明は、全てのコサイン変換/サイン変換に対して上記数式43のようにスパンセットを導出することができる。上記数式36のようにそれぞれ該当べき集合を構成することができ、上記数式37により変換組合せの決定に使用する変換セット
Figure 0007446988000178
を構成することができる。
また、実施形態(4)で提示した方式から導出した変換セット
Figure 0007446988000179
を利用して実施形態(3)で提示した様々な変換組合せを構成する方式を適用してみることもできる。
上記数式40ないし43のように1つの変換に入力前処理段階(ステップ)および出力後処理段階を様々な形態で追加する方式は、上記数式41ないし43のように三角変換(trigonometric transform)にのみ適用できるのではなく、他の任意の変換(例えは、KLT、SOTなど)にも適用されるので、それに対応するスパンセットを導出することができる。
また、上記数式40ないし43では、前後処理段階に該当する行列を
Figure 0007446988000180

Figure 0007446988000181
との組合せのみで構成したが、
Figure 0007446988000182
および
Figure 0007446988000183
以外の他の行列を有してもいずれの形態の演算により構成することもできる。
図18は、本発明が適用されるビデオコーディングシステムを示す。
ビデオコーディングシステムは、ソースデバイス(source device)および受信デバイス(receiving device)を含む。ソースデバイスは、エンコードされたビデオ/画像情報またはデータをファイルまたはストリーミング形式でデジタル記憶媒体またはネットワークを介して受信デバイスに伝達する。
上記ソースデバイスは、ビデオソース(video source)、エンコード装置(encoding apparatus)、送信部(transmitter)を含む。上記受信デバイスは、受信部(receiver)、デコード装置(decoding apparatus)およびレンダラ(renderer)を含む。上記エンコード装置は、ビデオ/画像エンコード装置と呼ばれてもよく、上記デコード装置は、ビデオ/画像デコード装置と呼ばれてもよい。送信器は、エンコード装置に含まれてもよい。受信器は、デコード装置に含まれてもよい。レンダラは、ディスプレイ部を含んでもよく、ディスプレイ部は、別のデバイスまたは外部コンポーネントで構成されてもよい。
ビデオソースは、ビデオ/画像のキャプチャ、合成または生成過程によりビデオ/画像を取得することができる。ビデオソースは、ビデオ/画像キャプチャデバイスおよび/またはビデオ/画像生成デバイスを含んでもよい。ビデオ/画像キャプチャデバイスは、例えば、1つまたは複数のカメラ、以前にキャプチャされたビデオ/画像を含むビデオ/画像アーカイブなどを含む。ビデオ/画像生成デバイスは、例えば、コンピュータ、タブレットおよびスマートフォンなどを含み、(電子的に)ビデオ/画像を生成することができる。例えば、コンピュータなどにより仮想のビデオ/画像が生成されることができ、この場合、関連データが生成される過程がビデオ/画像のキャッチャ過程に代わることができる。
エンコード装置は、入力ビデオ/画像をエンコードする。エンコードは、圧縮およびコーディング効率のために予測、変換、量子化などの一連の手順を行う。エンコードされたデータ(エンコードされたビデオ/画像情報)は、ビットストリーム形式で出力される。
送信部は、ビットストリーム形式で出力されたエンコードされたビデオ/画像情報またはデータを、ファイルまたはストリーミング形式でデジタル記憶媒体またはネットワークを介して受信デバイスの受信部に伝達する。デジタル記憶媒体は、USB、SD、CD、DVD、ブルーレイ、HDD、SSDなどの多様な記憶媒体を含む。送信部は、予め決められたファイルフォーマットによりメディアファイルを生成するためのエレメントを含み、放送/通信ネットワークを介した送信のためのエレメントを含む。受信部は、上記ビットストリームを抽出してデコード装置に伝達する。
デコード装置は、エンコード装置の動作に対応する逆量子化、逆変換、予測などの一連の手順を行ってビデオ/画像をデコードする。
レンダラは、デコードされたビデオ/画像をレンダリングする。レンダリングされたビデオ/画像は、ディスプレイ部を介して表示される。
図19は、本発明が適用される実施形態として、コンテンツストリーミングシステム構造図を示す。
図19に示すように、本発明が適用されるコンテンツストリーミングシステムは、概して、エンコードサーバ、ストリーミングサーバ、ウェブサーバ、メディア記憶装置(Media storage)、ユーザ装置およびマルチメディア入力装置を含む。
上記エンコードサーバは、スマートフォン、カメラ、カムコーダなどのマルチメディア入力装置から入力されたコンテンツをデジタルデータに圧縮してビットストリームを生成し、これを上記ストリーミングサーバに送信する役割を果たす。他の例として、スマートフォン、カメラ、カムコーダなどのマルチメディア入力装置がビットストリームを直接生成する場合、上記エンコードサーバは、省略されてもよい。
上記ビットストリームは、本発明が適用されるエンコード方法またはビットストリーム生成方法により生成され、上記ストリーミングサーバは、上記ビットストリームを送信または受信する過程で一時的に上記ビットストリームを記憶することができる。
上記ストリーミングサーバは、ウェブサーバを介するユーザ要求に基づいてマルチメディアデータをユーザ装置に送信し、上記ウェブサーバは、ユーザにどのようなサービスがあるかを知らせる媒介の役割を果たす。ユーザが上記ウェブサーバに希望のサービスを要求すると、上記ウェブサーバは、これをストリーミングサーバに伝達し、上記ストリーミングサーバは、ユーザにマルチメディアデータを送信する。ここで、上記コンテンツストリーミングシステムは、別途の制御サーバを含んでもよく、この場合、上記制御サーバは、上記コンテンツストリーミングシステム内の各装置間の命令/応答を制御する役割を果たす。
上記ストリーミングサーバは、メディア記憶装置および/またはエンコードサーバからコンテンツを受信する。例えば、上記エンコードサーバからコンテンツを受信する場合、上記コンテンツをリアルタイムに受信できる。この場合、円滑なストリーミングサービスを提供するために、上記ストリーミングサーバは、上記ビットストリームを一定時間記憶することができる。
上記ユーザ装置の例としては、携帯電話、スマートフォン(smart phone)、ノートブックコンピュータ(laptop computer)、デジタル放送用端末、PDA(Personal Digital Assistants)、PMP(Portable Multimedia Player)、ナビゲーション、スレートPC(slate PC)、タブレットPC(tablet PC)、ウルトラブック(ultrabook)、ウェアラブルデバイス(wearable device、例えば、スマートウォッチ(smartwatch)、スマートグラス(smart glass)、HMD(Head Mounted Display))、デジタルTV、デスクトップコンピュータ、デジタルサイネージなどを有することができる。
上記コンテンツストリーミングシステム内の各サーバは、分散サーバとして運用でき、この場合、各サーバで受信するデータは、分散処理されることができる。
前述したように、本発明で説明した実施形態は、プロセッサ、マイクロプロセッサ、コントローラまたはチップ上で実現されて行われることができる。例えば、各図面に示す機能ユニットは、コンピュータ、プロセッサ、マイクロプロセッサ、コントローラまたはチップ上で実現されて行われることができる。
また、本発明が適用されるデコーダおよびエンコーダは、マルチメディア放送送受信装置、モバイル通信端末、ホームシネマビデオ装置、デジタルシネマビデオ装置、監視用カメラ、ビデオ会話装置、ビデオ通信などのリアルタイム通信装置、モバイルストリーミング装置、記憶媒体、カムコーダ、ビデオオンデマンド(注文型ビデオ)(VoD)サービス提供装置、OTT(Over The Top Video)装置、インターネットストリーミングサービス提供装置、3次元(3D)ビデオ装置、画像電話ビデオ装置、および医療用ビデオ装置などに含まれることができ、ビデオ信号およびデータ信号を処理するために使用できる。例えば、OTTビデオ(Over The Top video)装置としては、ゲームコンソール、ブルーレイプレーヤ、インターネット接続TV、ホームシアターシステム、スマートフォン、タブレットPC、DVR(Digital Video Recorder)などが含まれる。
また、本発明が適用される処理方法は、コンピュータにより実行されるプログラムの形態で生産されることができ、コンピュータにより読み取りできる記録(記憶)媒体に記憶できる。本発明によるデータ構造を有するマルチメディアデータもまたコンピュータにより読み取りできる記録媒体に記憶できる。上記コンピュータにより読み取りできる記録媒体は、コンピュータにより読み取りできるデータが記憶される全ての種類の記憶装置および分散記憶装置を含む。上記コンピュータにより読み取りできる記録媒体は、例えば、ブルーレイディスク(BD)、ユニバーサルシリアルバス(汎用直列バス)(USB)、ROM、PROM、EPROM、EEPROM、RAM、CD-ROM、磁気テープ、フロッピ(登録商標)ディスク、および光学データ記憶装置を含むことができる。また、上記コンピュータにより読み取りできる記録媒体は、搬送波(例えば、インターネットを介する送信)の形態で実現されたメディアを含む。また、エンコード方法により生成されたビットストリームは、コンピュータにより読み取りできる記録媒体に記憶されるか、有無線通信ネットワークを介して送信できる。
また、本発明の実施形態は、プログラムコードによるコンピュータプログラム製品として実現され、上記プログラムコードは、本発明の実施形態によりコンピュータにおいて行われる。上記プログラムコードは、コンピュータにより読み取りできるキャリア上に記憶されることができる。
以上、前述した本発明の好ましい実施形態は、例示の目的のために開示されたものであり、当業者であれば、以下に添付された特許請求の範囲に開示された本発明の技術的思想とその技術的範囲内において、様々な他の実施形態を改良、変更、代替または付加などが可能であろう。

Claims (8)

  1. 適応マルチ変換(Adaptive Multiple Transforms;AMT)に基づいてビデオ信号をデコードする方法であって、
    前記ビデオ信号からAMTフラグを取得するステップであって、前記AMTフラグは、前記AMTが行われるか否かを表すのに使用されるステップと、
    前記AMTフラグに基づいて、前記ビデオ信号からAMTインデックスを取得するステップであって、
    前記AMTインデックスは、変換設定グループ内の複数の変換組合せのいずれか1つを示し、
    前記変換設定グループは、離散サイン変換タイプ7(Discrete Sine Transform type 7;DST7)および離散コサイン変換タイプ8(Discrete Cosine Transform type 8;DCT8)を有し、
    前記AMTインデックスは、水平変換および垂直変換に関する2つのインデックス情報を有する1つの変換インデックスである、ステップと、
    前記AMTインデックスに対応する変換組合せを導出するステップであって、
    前記変換組合せは、水平変換および垂直変換で構成され、前記DST7および前記DCT8の少なくとも1つを有する、ステップと、
    前記変換組合せに基づいて変換ユニットに対して逆変換を行うステップと、
    前記変換ユニットに基づいて前記ビデオ信号を復元するステップと、を有し、
    前記逆変換のための行列は、変換カーネルタイプと前記変換ユニットのサイズが32以下であることとに基づいて導出され
    前記方法は、0でない変換係数の個数が閾値より小さいか否かを確認するステップをさらに有し、
    前記0でない変換係数の個数が前記閾値より小さい場合、前記AMTインデックスは取得されず、
    前記閾値は、前記変換ユニットのサイズに基づいて異なるように決定される、方法。
  2. 前記変換組合せは、前記変換ユニットの予測モード、サイズおよび形状の少なくとも1つに基づいて選択される、請求項1に記載の方法。
  3. 前記AMTフラグに基づいてAMTが行われることに基づいて、0でない変換係数の個数が閾値より大きいか否かを確認するステップをさらに有し、
    前記AMTインデックスは、前記0でない変換係数の個数が前記閾値より大きいことに基づいて取得される、請求項1に記載の方法。
  4. 前記逆変換を行うステップは、
    前記垂直変換または前記水平変換が前記DST7または前記DCT8である場合、前記DST7の逆変換または前記DCT8の逆変換を列ごとに適用した後、行ごとに適用することを有する、請求項1に記載の方法。
  5. 前記垂直変換に関する異なる変換が各列に適用される、または、前記水平変換に関する異なる変換が各行に適用される、請求項1に記載の方法。
  6. 前記AMTフラグまたは前記AMTインデックスは、シーケンス、ピクチャ、スライス、ブロック、コーディングユニット、変換ユニットおよび予測ユニットの少なくとも1つのレベルにおいて定義される、請求項1に記載の方法。
  7. 適応マルチ変換(Adaptive Multiple Transforms;AMT)に基づいてビデオ信号をエンコードする方法であって、
    変換ユニットに適用される変換組合せを導出するステップであって、前記変換組合せは、水平変換および垂直変換で構成され、離散サイン変換タイプ7(Discrete Sine Transform type 7;DST7)および離散コサイン変換タイプ8(Discrete Cosine Transform type 8;DCT8)の少なくとも1つを有する、ステップと、
    前記変換組合せに基づいて、前記変換ユニットに対して変換を行うステップと、
    AMTフラグを生成するステップであって、前記AMTフラグは、前記AMTが行われるか否かを表すのに使用されるステップと、
    前記変換組合せに対応するAMTインデックスを生成するステップと、を有し、
    前記AMTインデックスは、複数の変換組合せのいずれか1つを示し、
    前記AMTインデックスは、水平変換および垂直変換に関する2つのインデックス情報を有する1つの変換インデックスであり、
    前記変換に関する行列は、変換カーネルタイプと前記変換ユニットのサイズが32以下であることとに基づいて導出され
    前記方法は、0でない変換係数の個数が閾値より小さいか否かを確認するステップをさらに有し、
    前記0でない変換係数の個数が前記閾値より小さい場合、前記AMTインデックスはエンコードされず、
    前記閾値は、前記変換ユニットのサイズに基づいて異なるように決定される、方法。
  8. 画像に関するビットストリームを有するデータに関する送信方法であって、
    前記画像に関する前記ビットストリームを取得するステップであって、前記ビットストリームは、
    変換ユニットに適用される変換組合せを導出するステップであって、前記変換組合せは、水平変換および垂直変換で構成され、離散サイン変換タイプ7(Discrete Sine Transform type 7;DST7)および離散コサイン変換タイプ8(Discrete Cosine Transform type 8;DCT8)の少なくとも1つを有する、ステップと、
    前記変換組合せに基づいて、前記変換ユニットに対して変換を行うステップと、
    適応マルチ変換(Adaptive Multiple Transforms;AMT)フラグを生成するステップであって、前記AMTフラグは、前記AMTが行われるか否かを表すのに使用されるステップと、
    前記変換組合せに対応するAMTインデックスを生成するステップと、によって生成される、ステップと、
    前記ビットストリームを有する前記データを送信するステップと、を有し、
    前記AMTインデックスは、複数の変換組合せのいずれか1つを示し、
    前記AMTインデックスは、水平変換および垂直変換に関する2つのインデックス情報を有する1つの変換インデックスであり、
    前記変換に関する行列は、変換カーネルタイプと前記変換ユニットのサイズが32以下であることとに基づいて導出され
    前記方法は、0でない変換係数の個数が閾値より小さいか否かを確認するステップをさらに有し、
    前記0でない変換係数の個数が前記閾値より小さい場合、前記AMTインデックスはエンコードされず、
    前記閾値は、前記変換ユニットのサイズに基づいて異なるように決定される、方法。
JP2020505860A 2017-08-04 2018-08-06 ビデオ圧縮のための変換を構成する方法および装置 Active JP7446988B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201762541103P 2017-08-04 2017-08-04
US62/541,103 2017-08-04
PCT/KR2018/008907 WO2019027302A1 (ko) 2017-08-04 2018-08-06 비디오 압축을 위한 변환을 구성하는 방법 및 장치

Publications (3)

Publication Number Publication Date
JP2020529782A JP2020529782A (ja) 2020-10-08
JP2020529782A5 JP2020529782A5 (ja) 2021-06-10
JP7446988B2 true JP7446988B2 (ja) 2024-03-11

Family

ID=65233487

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2020505860A Active JP7446988B2 (ja) 2017-08-04 2018-08-06 ビデオ圧縮のための変換を構成する方法および装置

Country Status (11)

Country Link
US (3) US11277640B2 (ja)
EP (1) EP3661214B1 (ja)
JP (1) JP7446988B2 (ja)
KR (4) KR102447500B1 (ja)
CN (1) CN111226442B (ja)
AU (2) AU2018311237B2 (ja)
BR (1) BR112020002317A8 (ja)
CA (3) CA3073674C (ja)
MX (2) MX2020001377A (ja)
RU (2) RU2769944C1 (ja)
WO (1) WO2019027302A1 (ja)

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102575635B1 (ko) 2016-02-12 2023-09-06 삼성전자주식회사 영상 부호화 방법 및 장치, 영상 복호화 방법 및 장치
CN114449270B (zh) 2017-07-04 2023-09-26 三星电子株式会社 使用多核变换的视频解码/编码方法和设备
FR3071690B1 (fr) * 2017-09-22 2022-09-30 Bcom Procede de decodage d'une image, procede de codage, dispositifs, equipement terminal et programmes d'ordinateurs associes
JP7036123B2 (ja) * 2017-12-05 2022-03-15 株式会社ソシオネクスト 符号化方法、復号方法、符号化装置、復号装置、符号化プログラム及び復号プログラム
CN116546199A (zh) 2018-08-12 2023-08-04 Lg电子株式会社 解码装置、编码装置、存储介质和发送图像的数据的装置
US11589075B2 (en) * 2018-10-01 2023-02-21 Lg Electronics Inc. Encoding/decoding method for video signal and device therefor
CN113411613B (zh) * 2019-01-11 2022-06-28 华为技术有限公司 对图像块进行视频译码的方法、解码设备和编/解码器
CN113905231A (zh) * 2019-03-09 2022-01-07 杭州海康威视数字技术股份有限公司 进行编码和解码的方法、解码端、编码端和系统
KR20220047725A (ko) * 2019-05-31 2022-04-19 인터디지털 브이씨 홀딩스 인코포레이티드 암시적 다중 변환 선택을 위한 변환 선택
MX2021016011A (es) * 2019-06-25 2022-02-22 Fraunhofer Ges Forschung Decodificador, codificador y metodos que comprenden una codificacion para intra-subparticiones.
CN115004704A (zh) * 2019-11-21 2022-09-02 北京达佳互联信息技术有限公司 变换与系数信令的方法和装置
GB2593778A (en) * 2020-04-03 2021-10-06 Sony Group Corp Video data encoding and decoding
GB2603559B (en) * 2021-07-22 2023-08-09 Imagination Tech Ltd Coding blocks of pixels
WO2023146358A1 (ko) * 2022-01-27 2023-08-03 세종대학교 산학협력단 영상 부호화/복호화 방법 및 장치

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160219290A1 (en) 2015-01-26 2016-07-28 Qualcomm Incorporated Enhanced multiple transforms for prediction residual

Family Cites Families (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003230140A (ja) * 2002-02-04 2003-08-15 Sony Corp 画像圧縮装置と画像圧縮方法、並びにその画像伸張装置と画像伸張方法
JP5259879B2 (ja) * 2010-07-15 2013-08-07 株式会社東芝 画像符号化方法及び画像復号化方法
US8885701B2 (en) * 2010-09-08 2014-11-11 Samsung Electronics Co., Ltd. Low complexity transform coding using adaptive DCT/DST for intra-prediction
GB2492333B (en) * 2011-06-27 2018-12-12 British Broadcasting Corp Video encoding and decoding using transforms
GB2559062B (en) * 2011-10-17 2018-11-14 Kt Corp Video decoding method using transform method selected from a transform method set
CN107360421B (zh) * 2011-10-17 2020-03-06 株式会社Kt 利用解码装置解码视频信号的方法
US9319684B2 (en) * 2012-08-21 2016-04-19 Qualcomm Incorporated Alternative transform in scalable video coding
WO2015172337A1 (en) * 2014-05-14 2015-11-19 Mediatek Singapore Pte. Ltd. Alternative transforms for data compression
ES2930030T3 (es) * 2014-11-28 2022-12-05 Hfi Innovation Inc Método y aparato de la transformada alternativa para la codificación de video
US10681379B2 (en) * 2015-09-29 2020-06-09 Qualcomm Incorporated Non-separable secondary transform for video coding with reorganizing
EP3439304A4 (en) * 2016-03-28 2020-02-26 KT Corporation VIDEO SIGNAL PROCESSING METHOD AND APPARATUS
CN113411580B (zh) * 2016-05-13 2024-01-30 夏普株式会社 图像解码装置及其方法、图像编码装置及其方法
CN109716767B (zh) * 2016-07-14 2021-09-21 弗劳恩霍夫应用研究促进协会 使用基于变换的残差编码的预测图像编码
US10554974B2 (en) * 2017-01-13 2020-02-04 Mediatek Inc. Method and apparatus enabling adaptive multiple transform for chroma transport blocks using control flags
EP3586511B1 (en) * 2017-03-16 2022-01-05 MediaTek Inc. Method and apparatus of enhanced multiple transforms and non-separable secondary transform for video coding
US10750181B2 (en) * 2017-05-11 2020-08-18 Mediatek Inc. Method and apparatus of adaptive multiple transforms for video coding
US11070806B2 (en) * 2017-06-28 2021-07-20 Lg Electronics Inc. Method and apparatus for performing low complexity computation in transform kernel for video compression
CN114449270B (zh) * 2017-07-04 2023-09-26 三星电子株式会社 使用多核变换的视频解码/编码方法和设备
US11303928B2 (en) * 2017-09-28 2022-04-12 Sharp Kabushiki Kaisha Image decoding apparatus and image coding apparatus
WO2019188466A1 (ja) * 2018-03-30 2019-10-03 ソニー株式会社 画像処理装置および方法
KR102488860B1 (ko) * 2018-09-02 2023-01-13 엘지전자 주식회사 영상 신호를 처리하기 위한 방법 및 장치
US11616966B2 (en) * 2019-04-03 2023-03-28 Mediatek Inc. Interaction between core transform and secondary transform
EP3949414A4 (en) * 2019-04-16 2023-04-12 HFI Innovation Inc. METHODS AND APPARATUS FOR CODING VIDEO DATA WITH ADAPTIVE SECONDARY TRANSFORM SIGNALING
CN113812162B (zh) * 2019-05-10 2022-12-30 北京字节跳动网络技术有限公司 视频中的简化二次变换的上下文建模
EP3989581A4 (en) * 2019-06-19 2023-06-28 LG Electronics Inc. Signaling of information indicating transform kernel set in image coding

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160219290A1 (en) 2015-01-26 2016-07-28 Qualcomm Incorporated Enhanced multiple transforms for prediction residual
WO2016123091A1 (en) 2015-01-26 2016-08-04 Qualcomm Incorporated Enhanced multiple transforms for prediction residual
JP2018506905A (ja) 2015-01-26 2018-03-08 クアルコム,インコーポレイテッド 予測残差のための機能強化された複数の変換

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
CHEN, Jianle et al.,Algorithm Description of Joint Exploration Test Model 5 (JEM 5),JVET-E1001 (version 2),ITU,2017年02月11日,pp.1-3, 27-33,JVET-E1001-v2.docx
ZHAO, Xin et al.,Enhanced Multiple Transform for Video Coding,Proc. Data Compression Conference 2016,米国,IEEE,2016年12月19日,pp.73-82,[online],Retrieved from the Internet: <URL: https://ieeexplore.ieee.org/document/7786151>,https://doi.org/10.1109/DCC.2016.9

Also Published As

Publication number Publication date
US20220167018A1 (en) 2022-05-26
US11825119B2 (en) 2023-11-21
CA3073674C (en) 2022-11-29
BR112020002317A2 (pt) 2020-09-08
CA3073674A1 (en) 2019-02-07
EP3661214A1 (en) 2020-06-03
CN111226442B (zh) 2022-06-21
US11277640B2 (en) 2022-03-15
JP2020529782A (ja) 2020-10-08
US20200177921A1 (en) 2020-06-04
CA3175176A1 (en) 2019-02-07
WO2019027302A1 (ko) 2019-02-07
EP3661214B1 (en) 2022-07-20
BR112020002317A8 (pt) 2023-01-24
AU2021258067B2 (en) 2023-02-16
MX2023012003A (es) 2023-10-20
KR102629234B1 (ko) 2024-01-24
RU2769944C1 (ru) 2022-04-11
RU2745021C1 (ru) 2021-03-18
AU2018311237A1 (en) 2020-03-05
CN111226442A (zh) 2020-06-02
AU2021258067A1 (en) 2021-11-25
KR102385399B1 (ko) 2022-04-11
KR20220132065A (ko) 2022-09-29
MX2020001377A (es) 2020-03-09
EP3661214A4 (en) 2020-06-03
CA3238672A1 (en) 2019-02-07
KR20240015154A (ko) 2024-02-02
KR20220048044A (ko) 2022-04-19
US20240056607A1 (en) 2024-02-15
KR102447500B1 (ko) 2022-09-23
KR20200023480A (ko) 2020-03-04
AU2018311237B2 (en) 2021-07-29

Similar Documents

Publication Publication Date Title
JP7446988B2 (ja) ビデオ圧縮のための変換を構成する方法および装置
KR102659354B1 (ko) 축소된 변환을 이용하여 비디오 신호를 처리하는 방법 및 장치
KR102599446B1 (ko) 인트라 예측 모드에 기초하여 변환 인덱스 코딩을 수행하는 방법 및 이를 위한 장치
KR20240017106A (ko) 축소된 2차 변환을 이용하여 비디오 신호를 처리하는 방법 및 장치
US11503298B2 (en) Signaling of information indicating transform kernel set in image coding
KR102664785B1 (ko) 비디오 신호를 처리하기 위한 방법 및 장치
US11570438B2 (en) Coding of information about transform kernel set
US20230209061A1 (en) Context coding for information on transform kernel set in image coding system
RU2795258C1 (ru) Способ и устройство для конфигурирования преобразования для сжатия видео

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20210312

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210420

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20220421

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20220510

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20220809

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20221003

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20230117

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230414

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20230801

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20231115

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20231127

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20240130

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20240228

R150 Certificate of patent or registration of utility model

Ref document number: 7446988

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350