JP2023058526A - 統一された有意性マップ符号化方法および装置 - Google Patents

統一された有意性マップ符号化方法および装置 Download PDF

Info

Publication number
JP2023058526A
JP2023058526A JP2023009137A JP2023009137A JP2023058526A JP 2023058526 A JP2023058526 A JP 2023058526A JP 2023009137 A JP2023009137 A JP 2023009137A JP 2023009137 A JP2023009137 A JP 2023009137A JP 2023058526 A JP2023058526 A JP 2023058526A
Authority
JP
Japan
Prior art keywords
transform coefficients
context
unified
transforms
rules
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2023009137A
Other languages
English (en)
Other versions
JP7445030B2 (ja
Inventor
ルウ,シヤオアン
Xiaoan Lu
ソレ,ジヨエル
Sole Joel
イン,ペン
Peng Yin
シユウ,チヤン
Qian Xu
ジエン,ユンフエイ
Zheng Yunfei
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
InterDigital Madison Patent Holdings SAS
Original Assignee
InterDigital Madison Patent Holdings SAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by InterDigital Madison Patent Holdings SAS filed Critical InterDigital Madison Patent Holdings SAS
Publication of JP2023058526A publication Critical patent/JP2023058526A/ja
Application granted granted Critical
Publication of JP7445030B2 publication Critical patent/JP7445030B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • H03M7/40Conversion to or from variable length codes, e.g. Shannon-Fano code, Huffman code, Morse code
    • H03M7/4006Conversion to or from arithmetic code
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/12Selection from among a plurality of transforms or standards, e.g. selection between discrete cosine transform [DCT] and sub-band transform or selection between H.263 and H.264
    • H04N19/122Selection of transform size, e.g. 8x8 or 2x4x8 DCT; Selection of sub-band transforms of varying structure or type
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/13Adaptive entropy coding, e.g. adaptive variable length coding [AVLC] or context adaptive binary arithmetic coding [CABAC]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/91Entropy coding, e.g. variable length coding [VLC] or arithmetic coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/18Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a set of transform coefficients
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/63Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using sub-band based transform, e.g. wavelets
    • H04N19/64Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using sub-band based transform, e.g. wavelets characterised by ordering of coefficients or of bits for transmission

Abstract

【課題】統一された有意性マップ符号化方法およびビデオ符号化器を備える装置を提供する。【解決手段】ピクチャの少なくとも一部分の複数の変換係数を符号化するビデオ符号化器を含む装置における方法であって、変換係数は、複数の変換を用いて得られ、これらの変換係数に対して、統一された規則に基づいて、1つまたは複数のコンテキスト共有マップを生成する。これらの1つまたは複数のコンテキスト共有マップは、上記ピクチャの少なくとも一部分の複数の変換のうちの少なくとも2つの異なる変換から得られる変換係数のうちの、少なくとも一部の間で共有される少なくとも1つのコンテキストを提供する。【選択図】図8

Description

(関連出願の相互参照)
本願は、2010年5月12日出願の米国仮出願第61/333,808号の利益を主張するものである。
本発明の原理は、一般にビデオ符号化およびビデオ復号に関し、さらに詳細には、統一された有意性マップ符号化方法および装置に関する。
入力ビデオ・コンテンツの非静的特性を活用するために、ビデオ符号化器は、入力ビデオ信号を可変長符号化シンタックス要素のビットストリームにマッピングするエントロピー符号化を使用している。頻繁に現れるシンボルは短い符号語で表され、あまり現れないシンボルは長い符号語で表される。
International Organization for Standardization/International Electrotechnical Commission(ISO/IEC)Moving Picture Experts Group-4(MPEG-4) Part 10 Advanced Video Coding(AVC)規格/International Telecommunication Union,Telecommunication Sector(ITU-T)H.264勧告(以下「MPEG-4 AVC規格」)は、2つのエントロピー符号化方法をサポートしている。具体的には、シンボルは、エントロピー符号化モードに応じて、可変長コード(VLC)またはコンテキスト適応型算術符号化(CABAC)を用いて符号化される。CABACを用いると、データ・シンボルを符号化するプロセスは、以下の3つの基本ステップを含む。
1.2値化。2値化ステップでは、所与の2値でないシンタックス要素を、ビン列(bin string)と呼ばれる2値シーケンスに一意的にマッピングする。このプロセスは、シンボルを可変長コードに変換するプロセスと同様であるが、2値符号値がさらに符号化される。
2.コンテキスト・モデル化。「コンテキスト・モデル」は、ビン列の1つまたは複数のビン(bin)の確率モデルであり、直近に符号化されたデータ・シンボルの統計値に応じて1組の利用可能なモデルから選択される。コンテキスト・モデルは、各ビンが「1」または「0」である確率を記憶したものであり、実際の符号化値に基づいて更新される。
3.2値算術符号化。算術符号化器が、選択した確率モデルに従って各ビンを符号化する。
MPEG-4 AVC規格では、各シンタックス要素のコンテキスト・モデルおよび2値化方式がその規格で定義されている。各ビンのコンテキスト・モデルは、コンテキスト・インデックスγによって識別され、所与のコンテキスト・インデックスγに関連する各確率モデルは、2つの値の対、すなわち最確シンボル(MPS)の確率状態インデックスσγおよび値(2値)
Figure 2023058526000002

によって決まる。
コンテキスト・テンプレートTと呼ばれる既定の過去のシンボルの集合と、コンテキストがテンプレートTに作用するモデル化関数F:T→Cによって指定されるコンテキストの関連集合C={0,…,C-1}とが与えられたと考える。符号化対象の各シンボルxについて、既に符号化された隣接するシンボルz∈Tに従って異なる確率モデル間で切替えを行うことにより、条件付き確率p(x|F(z))を推定する。推定した条件付き確率p(x|F(z))を用いてxを符号化した後で、符号化シンボルxの値で確率モデルを更新する。従って、p(x|F(z))は、実際のソース統計を追跡することによってオン・ザ・フライで推定される。モデル・コストを低減し、Cの数が大きくなることによってp(x|F(z))の推定が不正確になるのを回避するために、MPEG-4 AVC規格では、コンテキスト・モデルの選択に2つの制約を課している。第1の制約は、現在符号化しているシンボルの数個の隣接するシンボルからなる非常に限られたコンテキスト・テンプレートTを利用することである。第2の制約は、コンテキスト・モデル化を、2値化シンボルの選択されたビンに制限することである。
量子化パラメータは、様々なデータ・シンボルの発生確率に有意な影響を及ぼすので、各符号化スライスの冒頭で、量子化パラメータ(QP)の初期値に応じてコンテキスト・モデルを初期化する。
MPEG-4 AVC規格の残差データのCABACエントロピー符号化
MPEG-4 AVC規格による残差データのCABAC符号化では、シンタックス要素およびそれらに関連する符号化方式は、以下の明確な特徴によって特徴付けられる。
・1ビット・シンボルcoded_block_flagおよび2値有意性マップを使用して、所与のブロック中の非ゼロ変換係数(すなわち、有意係数)の発生および位置を示す。
・非ゼロ・レベルは、逆走査順序で符号化される。
・非ゼロ変換係数を符号化するためのコンテキスト・モデルは、逆走査経路内の以前に伝送された非ゼロ・レベルの数に基づいて選択される。
図1を参照すると、MPEG-4 AVC規格による有意性マップ符号化手順の一例の全体が、参照番号100で示してある。手順100は、制御を機能ブロック120に渡す開始ブロック110を含む。機能ブロック120では、シンタックス要素coded_block_flagを符号化し、制御を判断ブロック130に渡す。判断ブロック130では、coded_block_flagが1に等しいか否かを判定する。coded_block_flagが1に等しい場合には、制御は、機能ブロック140に渡される。そうでない場合には、制御は、終了ブロック199に渡される。機能ブロック140では、有意性マップの符号化に関連するステップを実行し、制御を機能ブロック150に渡す。機能ブロック150では、レベル情報の符号化に関連するステップを実行し、制御を終了ブロック199に渡す。従って、判断ブロック130に関しては、coded_block_flagがブロックが有意係数を有していることを示している場合には、機能ブロック140で2値有意性マップを符号化する。走査順序の各係数について、機能ブロック140で、1ビット・シンボルsignificant_coeff_flagが伝送される。significant_coeff_flagシンボルが1に等しい場合、すなわち非ゼロ係数がこの走査位置に存在している場合には、機能ブロック140で、別の1ビット・シンボルlast_significant_coeff_flagが送信される。このシンボルlast_significant_coeff_flagは、現在の有意係数がブロック内の最後の係数であるかどうか、すなわち後続の別の有意係数があるかどうかを示す。
変換係数の有意性マップを符号化するときに、significant_coeff_flagおよびlast_significant_coeff_flagのコンテキスト・モデルの選択は、走査位置によって決まる。MPEG-4 AVC規格では、4×4またはそれより小さい変換サイズでは、コンテキスト・モデルは、各位置のsignificant_coeff_flagおよびlast_significant_coeff_flagにそれぞれ割り当てられる。8×8およびそれより大きい変換サイズでは、コンテキスト・モデルの数を減らすために、いくつかの変換係数位置で1つのコンテキスト・モデルを共有する。
KTAでの有意性マップ符号化
video coding experts group(VCEG)「key technical area」(KTA)ソフトウェアは、MPEG-4 AVC規格が完成した後のビデオ符号化の新たな進歩を統合する共通のプラットフォームを提供している。拡張ブロック・サイズおよび大きな変換を使用するという提案がKTAでは採用されている。現在のKTAソフトウェアでは、16×16画素より大きな動きパーティションが実施される。具体的には、既存のMPEG-4 AVC規格のパーティションサイズに加えて、64×64、64×32、32×64、32×32、32×16、16×32のサイズのマクロブロックが使用される。高精細度ビデオのさらに滑らかなコンテンツをより良質に取り込むために、それより大きなブロック変換も使用される。このようなさらに大きなブロック変換としては、16×16、16×8および8×16のサイズを有するブロック変換が挙げられる。コンテキスト・モデルの数を少なく抑えるために、8×16、16×8および16×16の変換は全て、significant_coeff_flagまたはlast_significant_coeff_flagに対して15個以下のコンテキスト・モデルを使用する。図2を参照すると、8×8ブロックのシンタックス要素significant_coeff_flagに対して15個のコンテキストを使用する一例の全体が、参照番号200で示してある。さらに詳細には、例200は、significant_coeff_flagに対して8×8変換を用いるときに、1つのブロック内の複数の変換係数位置が、どのようにして1つのコンテキスト・モデルを共有するかを示している。異なる各数字は、コンテキスト・モデルを表している。1つの数字が複数の位置で繰り返されているとき、この複数の位置が1つのコンテキスト・モデルを共有している。この手法では、複数の変換係数位置が1つのコンテキストをどのように共有するか、すなわちコンテキスト共有は、変換サイズごとに設計される。コンテキスト共有の正確なパターンを、コンテキスト共有マップと呼ぶ。
図3を参照すると、16×16ブロックのシンタックス要素significant_coeff_flagに対して15個のコンテキストを使用する一例の全体が、参照番号300で示してある。さらに詳細には、例300は、significant_coeff_flagに対して16×16変換を用いるときに、1つのブロック内の複数の変換係数位置が、どのようにして1つのコンテキスト・モデルを共有するかを示している。16×16変換のコンテキスト共有のパターンは、ほぼ8×8変換のアップサンプリング・バージョンである。ただし、この場合、異なる変換の係数分布の違いを捕捉することができない可能性もあるという欠点がある。
特定の従来技術の手法による有意性マップ符号化 特定の従来技術の手法では、8×8およびそれより大きな変換サイズに対する新たなコンテキスト・モデル化手法が提案されていた。8×8ブロックのシンタックス要素significant_coeff_flagのコンテキストをモデル化するために、変換ブロックを2×2個のサンプルで構成される16個のサブブロックに分解し、これらのサブブロックをそれぞれ別個のコンテキストと関連付ける。それより大きな変換ブロック(例えば8×8より大きなブロック)のコンテキスト・モデルの選択は、既定の近傍(変換ブロック内)の既に符号化されている有意変換係数の数に基づく。last_significant_coeff_flagの符号化では、現在の走査位置から所与の変換ブロックの左上隅までの距離寸法に依存するコンテキスト・モデル化が設計されている。さらに詳細には、last_significant_coeff_flagを符号化するためのコンテキスト・モデルは、現在の走査位置を通る走査対角線に基づいて選択される(すなわち、xおよびyがそれぞれ変換ブロック内の走査位置の水平方向位置および垂直方向位置を表しているものとして、x+yに基づいて選択される)。過学習を避けるために、距離寸法x+yは、特定の方法で(例えばx+yを量子化することによって)縮小したコンテキスト・モデルのセットにマッピングされる。
この特定の従来技術の方法では、8×8変換のコンテキスト共有のパターンは、ほぼ4×4変換のアップサンプリング・バージョンである。ただし、この場合、異なる変換の係数分布の違いを捕捉することができない可能性もあるという欠点がある。
既存のビデオ符号化規格では、8×8変換またはそれより大きな変換の変換係数の有意性マップを符号化する際に、複数の変換係数の間で1つのコンテキストを共有して、コンテキストの数を減らす。コンテキストをどのように共有するかに基づいて、様々な変換に対して別々の方法が使用される。このような設計は、使用される変換の数がさらに増える可能性がある将来の規格に、容易には拡張することができない。
本発明の原理は、従来技術の上記その他の欠陥および欠点に対処するものであり、統一された有意性マップ符号化方法および装置を対象とする。
本発明の原理の1つの態様によると、装置が提供される。この装置は、ピクチャの少なくとも一部分の複数の変換係数を符号化するビデオ符号化器を含む。変換係数は、複数の変換を用いて得られる。これらの変換係数に対して、統一された規則に基づいて、1つまたは複数のコンテキスト共有マップが生成される。これらの1つまたは複数のコンテキスト共有マップは、上記の複数の変換のうちの少なくとも2つの異なる変換から得られる変換係数のうちの少なくとも一部の間で共有される少なくとも1つのコンテキストを提供するものである。
本発明の原理の別の態様によると、ビデオ符号化器における方法が提供される。この方法は、ピクチャの少なくとも一部分の複数の変換係数を符号化するステップを含む。変換係数は、複数の変換を用いて得られる。これらの変換係数に対して、統一された規則に基づいて、1つまたは複数のコンテキスト共有マップが生成される。これらの1つまたは複数のコンテキスト共有マップは、上記の複数の変換のうちの少なくとも2つの異なる変換から得られる変換係数のうちの少なくとも一部の間で共有される少なくとも1つのコンテキストを提供するものである。
本発明の原理のさらに別の態様によると、装置が提供される。この装置は、ピクチャの少なくとも一部分の複数の変換係数を復号するビデオ復号器を含む。変換係数は、複数の変換を用いて得られる。これらの変換係数に対して、統一された規則に基づいて、1つまたは複数のコンテキスト共有マップが生成される。これらの1つまたは複数のコンテキスト共有マップは、上記の複数の変換のうちの少なくとも2つの異なる変換から得られる変換係数のうちの少なくとも一部の間で共有される少なくとも1つのコンテキストを提供するものである。
本発明の原理のさらに別の態様によると、ビデオ復号器における方法が提供される。この方法は、ピクチャの少なくとも一部分の複数の変換係数を復号するステップを含む。変換係数は、複数の変換を用いて得られる。これらの変換係数に対して、統一された規則に基づいて、1つまたは複数のコンテキスト共有マップが生成される。これらの1つまたは複数のコンテキスト共有マップは、上記の複数の変換のうちの少なくとも2つの異なる変換から得られる変換係数のうちの少なくとも一部の間で共有される少なくとも1つのコンテキストを提供するものである。
本発明の原理の上記その他の態様、特徴および利点は、以下の例示的な実施形態の詳細な説明を、添付の図面と関連付けて読めば、明らかになるであろう。
本発明の原理は、以下の例示的な図面によってよりよく理解することができる。
MPEG-4 AVC規格による有意性マップ符号化手順の一例を示す図で ある。 8×8ブロックのシンタックス要素significant_coeff_ flagに対して15個のコンテキストを使用する例を示す図である。 16×16ブロックのシンタックス要素significant_coef f_flagに対して15個のコンテキストを使用する例を示す図である。 本発明の原理の一実施形態による、本発明の原理を適用することができる例 示的なビデオ符号化器を示すブロック図である。 本発明の原理の一実施形態による、本発明の原理を適用することができる例 示的なビデオ復号器を示すブロック図である。 有意性マップを符号化する従来の方法を示す流れ図である。 有意性マップを復号する従来の方法を示す流れ図である。 本発明の原理の一実施形態による、有意性マップを符号化する例示的な方法 を示す流れ図である。 本発明の原理の一実施形態による、有意性マップを復号する例示的な方法を 示す流れ図である。 本発明の原理の一実施形態による、有意性マップを符号化する別の方法を 示す流れ図である。 本発明の原理の一実施形態による、有意性マップを復号する別の例示的な 方法を示す流れ図である。
本発明の原理は、統一された有意性マップ符号化方法および装置を対象とするものである。
本明細書は、本発明の原理を例示するものである。従って、本明細書に明示的には記述または図示していなくても、本発明の原理を実現し、本発明の原理の趣旨および範囲に含まれる様々な構成を、当業者なら考案することができることを理解されたい。
本明細書に記載する全ての例および条件に関する表現は、本発明の原理と、当技術分野をさらに進歩させるために発明者(等)が与える概念とを、読者が理解するのを助けるという教育的な目的を有するものであって、これらの具体的に記載した例および条件に限定されるわけではないものと解釈されたい。
さらに、本発明の原理の原理、態様および実施形態ならびに本発明の原理の具体的な例について本明細書で述べる全ての記述は、その構成的均等物および機能的均等物の両方を含むものとする。さらに、これらの均等物には、現在既知の均等物だけでなく、将来開発されるであろう均等物も含まれる、すなわち、その構成にかかわらず、同じ機能を実行する開発される任意の要素も含まれるものとする。
従って、例えば、当業者なら、本明細書に示すブロック図が本発明の原理を実施する例示的な回路の概念図を表していることを理解するであろう。同様に、任意のフローチャート、流れ図、状態遷移図、擬似コードなどが、コンピュータ可読媒体で実質的に表現することができ、明示してある場合もしていない場合もあるコンピュータまたはプロセッサによって実質的に実行することができる様々なプロセスを表すことも理解されたい。
図面に示す様々な要素の機能は、専用のハードウェアを使用することによって、またソフトウェアを実行することができるハードウェアを適当なソフトウェアと関連付けて使用することによって、実現することができる。プロセッサによってそれらの機能を実現するときには、単一の専用プロセッサで実現することも、単一の共用プロセッサで実現することも、あるいはその一部を共用することもできる複数の個別プロセッサで実現することもできる。さらに、「プロセッサ」または「制御装置」という用語を明示的に用いていても、ソフトウェアを実行することができるハードウェアのみを指していると解釈すべきではなく、ディジタル信号プロセッサ(「DSP」)ハードウェア、ソフトウェアを記憶するための読取り専用メモリ(「ROM」)、ランダム・アクセス・メモリ(「RAM」)および不揮発性記憶装置(ただしこれらに限定されない)を暗に含むことがある。
従来の、且つ/または特注のその他ハードウェアも含まれることがある。同様に、図面に示す任意のスイッチも、概念的なものに過ぎない。それらの機能は、プログラム論理の動作によっても、ハードウェア論理によっても、プログラム制御とハードウェア論理の相互作用によっても、あるいは手作業でも実施することができ、実施者が、状況から適宜判断して特定の技術を選択することができる。
本明細書の特許請求の範囲において、特定の機能を実行する手段として表現されている任意の要素は、当該機能を実行する任意の形態を含むものとする。例えば、(a)当該機能を実行する回路素子の組合せや、(b)ファームウェアやマイクロコードなども含めた任意の形態のソフトウェアを、当該ソフトウェアを実行して当該機能を実行する適当な回路と組み合わせたものなども含むものとする。かかる特許請求の範囲によって定義される本発明の原理は、記載した様々な手段が実施する機能を、特許請求の範囲が要求する形式で組み合わせ、まとめることにある。従って、これらの機能を実施することができる任意の手段を、本明細書に示す手段の均等物とみなすものとする。
本明細書において、本発明の原理の「一実施形態」または「実施形態」ならびにその他の変形例と述べている場合、それは、当該実施形態に関連して述べられる特定の特性、構成、特徴などが、本発明の原理の少なくとも1つの実施形態に含まれるという意味である。従って、本明細書の様々な箇所に見られる「一実施形態において」または「実施形態において」という表現、ならびに任意の他の変形表現は、その全てが必ずしも同じ実施形態のことを指しているわけではない。
例えば「A/B」、「Aおよび/またはB」ならびに「AおよびBの少なくとも1つ」の場合など、「/」、「および/または」ならびに「の少なくとも1つ」の何れかを使用している場合、それは、1番目に挙げた選択肢(A)のみを選択すること、または2番目に挙げた選択肢(B)のみを選択すること、または両方の選択肢(AおよびB)を選択することを含むということであることを理解されたい。さらに別の例として、「A、Bおよび/またはC」ならびに「A、BおよびCの少なくとも1つ」の場合には、この表現は、1番目に挙げた選択肢(A)のみを選択すること、または2番目に挙げた選択肢(B)のみを選択すること、または3番目に挙げた選択肢(C)のみを選択すること、または1番目と2番目に挙げた選択肢(AおよびB)のみを選択すること、または1番目と3番目に挙げた選択肢(AおよびC)のみを選択すること、または2番目と3番目に挙げた選択肢(BおよびC)のみを選択すること、または3つ全ての選択肢(AおよびBおよびC)を選択することを含むということである。当技術分野および関連技術分野の当業者には容易に分かるように、このことは、列挙されている項目の数に応じて拡張することができる。
また、本明細書で使用する「ピクチャ」および「画像」という用語は、入れ替えて使用され、ビデオ・シーケンスに含まれる静止画像またはピクチャを指している。既知の通り、ピクチャは、フレームであってもフィールドであってもよい。
さらに、本明細書で使用する「有意係数」および「有意変換係数」という表現は、非ゼロ値を有する変換係数を指す。
さらに、本明細書で使用する「レベル情報」という表現は、変換係数の値を指す。
例示および説明のために、本明細書では、video coding experts group(VCEG)key technical area(KTA)ソフトウェアの改良という状況でいくつかの例について述べ、本明細書の基準としてKTAソフトウェアを用いて、KTAソフトウェアに優る改良点および拡張点を説明する。ただし、本発明の原理は、KTAソフトウェアおよび/またはその拡張のみに限定されるわけではないことを理解されたい。本明細書に与える本発明の原理の教示があれば、当技術分野および関連技術分野の当業者なら、本発明の原理が他の規格にも同様に適用可能であり、他の規格の拡張に適用されれば、あるいはこれから開発される規格に適用され、且つ/または組み込まれれば、少なくとも同等の利益を提供することを容易に理解するであろう。さらに、本発明の原理は、規格に準拠するのではなく所有者の定義(proprietary definitions)に準拠するビデオ符号化器およびビデオ復号器にも適用されることも理解されたい。
図4を参照すると、本発明の原理を適用することができる例示的なビデオ符号化器の全体が、参照番号400で示してある。ビデオ符号化器400は、結合器485の非反転入力部と信号通信する出力部を有するフレーム順序付けバッファ410を含む。結合器485の出力部は、変換器/量子化器425の第1の入力部に信号通信で接続される。変換器/量子化器425の出力部は、エントロピー・コーダ445の第1の入力部および逆変換器/逆量子化器450の第1の入力部に信号通信で接続される。エントロピー・コーダ445の出力部は、結合器490の第1の非反転入力部に信号通信で接続される。結合器490の出力部は、出力バッファ435の第1の入力部に信号通信で接続される。
符号化器制御装置405の第1の出力部は、フレーム順序付けバッファ410の第2の入力部、逆変換器/逆量子化器450の第2の入力部、ピクチャ・タイプ判断モジュール415の入力部、マクロブロック・タイプ(MBタイプ)判断モジュール420の第1の入力部、イントラ予測モジュール460の第2の入力部、デブロッキング・フィルタ465の第2の入力部、動き補償器470の第1の入力部、動き推定器475の第1の入力部、および参照ピクチャ・バッファ480の第2の入力部に信号通信で接続される。
符号化器制御装置405の第2の出力部は、付加拡張情報(SEI)挿入器430の第1の入力部、変換器/量子化器425の第2の入力部、エントロピー・コーダ445の第2の入力部、出力バッファ435の第2の入力部、およびシーケンス・パラメータ・セット(SPS)/ピクチャ・パラメータ・セット(PPS)挿入器440の入力部に信号通信で接続される。
SEI挿入器430の出力部は、結合器490の第2の非反転入力部に信号通信で接続される。
ピクチャ・タイプ判断モジュール415の第1の出力部は、フレーム順序付けバッファ410の第3の入力部に信号通信で接続される。ピクチャ・タイプ判断モジュール415の第2の出力部は、マクロブロック・タイプ判断モジュール420の第2の入力部に信号通信で接続される。
シーケンス・パラメータ・セット(SPS)/ピクチャ・パラメータ・セット(PPS)挿入器440の出力部は、結合器490の第3の非反転入力部に信号通信で接続される。
逆量子化器/逆変換器450の出力部は、結合器419の第1の非反転入力部に信号通信で接続される。結合器419の出力部は、イントラ予測モジュール460の第1の入力部およびデブロッキング・フィルタ465の第1の入力部に信号通信で接続される。デブロッキング・フィルタ465の出力部は、参照ピクチャ・バッファ480の第1の入力部に信号通信で接続される。参照ピクチャ・バッファ480の出力部は、動き推定器475の第2の入力部および動き補償器470の第3の入力部に信号通信で接続される。動き推定器475の第1の出力部は、動き補償器470の第2の入力部に信号通信で接続される。動き推定器475の第2の出力部は、エントロピー・コーダ445の第3の入力部に信号通信で接続される。
動き補償器470の出力部は、スイッチ497の第1の入力部に信号通信で接続される。イントラ予測モジュール460の出力部は、スイッチ497の第2の入力部に信号通信で接続される。マクロブロック・タイプ判断モジュール420の出力部は、スイッチ497の第3の入力部に信号通信で接続される。スイッチ497の第3の入力部は、スイッチの「データ」入力(制御入力部すなわち第3の入力部と比べて)が、動き補償器470またはイントラ予測モジュール460によって与えられるか否かを判定する。スイッチ497の出力部は、結合器419の第2の非反転入力部および結合器485の反転入力部に信号通信で接続される。
フレーム順序付けバッファ410の第1の入力部および符号化器制御装置405の入力部は、符号化器400の、入力ピクチャを受信するための入力部として利用することができる。さらに、付加拡張情報(SEI)挿入器430の第2の入力部は、符号化器400の、メタデータを受信するための入力部として利用することができる。出力バッファ435の出力部は、符号化器400の、ビットストリームを出力するための出力部として利用することができる。
図5を参照すると、本発明の原理を適用することができる例示的なビデオ復号器の全体が、参照番号500で示してある。ビデオ復号器500は、エントロピー復号器545の第1の入力部に信号通信で接続された出力部を有する入力バッファ510を含む。エントロピー復号器545の第1の出力部は、逆変換器/逆量子化器550の第1の入力部に信号通信で接続される。逆変換器/逆量子化器550の出力部は、結合器525の第2の非反転入力部に信号通信で接続される。結合器525の出力部は、デブロッキング・フィルタ565の第2の入力部およびイントラ予測モジュール560の第1の入力部に信号通信で接続される。デブロッキング・フィルタ565の第2の出力部は、参照ピクチャ・バッファ580の第1の入力部に信号通信で接続される。参照ピクチャ・バッファ580の出力部は、動き補償器570の第2の入力部に信号通信で接続される。
エントロピー復号器545の第2の出力部は、動き補償器570の第3の入力部、デブロッキング・フィルタ565の第1の入力部、およびイントラ予測器560の第3の入力部に信号通信で接続される。エントロピー復号器545の第3の出力部は、復号器制御装置505の入力部に信号通信で接続される。復号器制御装置505の第1の出力部は、エントロピー復号器545の第2の入力部に信号通信で接続される。復号器制御装置505の第2の出力部は、逆変換器/逆量子化器550の第2の入力部に信号通信で接続される。復号器制御装置505の第3の出力部は、デブロッキング・フィルタ565の第3の入力部に信号通信で接続される。復号器制御装置505の第4の出力部は、イントラ予測モジュール560の第2の入力部、動き補償器570の第1の入力部、および参照ピクチャ・バッファ580の第2の入力部に信号通信で接続される。
動き補償器570の出力部は、スイッチ597の第1の入力部に信号通信で接続される。イントラ予測モジュール560の出力部は、スイッチ597の第2の入力部に信号通信で接続される。スイッチ597の出力部は、結合器525の第1の非反転入力部に信号通信で接続される。
入力バッファ510の入力部は、復号器500の、入力ビットストリームを受信するための入力部として利用することができる。デブロッキング・フィルタ565の第1の出力部は、復号器500の、出力ピクチャを出力するための出力部として利用することができる。
上述のように、本発明の原理は、統一された有意性マップ符号化方法および装置を対象としている。様々な変換サイズの係数分布を考慮するために、発明者等は、簡潔にするために全ての変換サイズについてある統一された構造を維持しながら、コンテキスト共有パターンを変換サイズに適合させる。
残差データを符号化する際のコンテキストの数を低減するために、いくつかの変換係数位置で1つのコンテキスト・モデルを共有することができる。MPEG-4 AVC規格では、コンテキスト共有は、変換ごとに設計される。
本発明の原理の一実施形態では、発明者等は、規則が符号化器のセットアップに適合可能である、全ての変換についてコンテキストを共有する方法を設計する統一された規則ベース(unified rule-based)手法を提案する。
本発明の原理の一実施形態では、発明者等は、複数の変換についてコンテキスト共有を統一することを提案する。コンテキスト・モデルの数は小さい数に維持しながら、異なる変換で複数の係数位置の間のコンテキスト共有を設計する同じ手法を用いる。これにより、コンテキスト共有を統一して、さらに多くの変換に対応できる次世代の規格に備える。
本発明の原理は、有意性マップを符号化する新たな方法を提案するものである。変換ごとに別個のコンテキスト共有方法が予め規定される従来技術とは異なり、発明者等は、異なる変換の間でコンテキスト共有を統一する方法を提供する。これにより、特に複数の変換が存在するときには、符号化器および/または復号器の設計が簡略化される。
<典型的な有意性マップ符号化>
図6を参照すると、有意性マップを符号化する従来の方法の全体が、参照番号600で示してある。方法600は、制御を機能ブロック620に渡す開始ブロック610を含む。機能ブロック620では、変換の既定のコンテキスト共有マップを読み取り、制御を機能ブロック630に渡す。機能ブロック630では、有意性マップを符号化し、制御を終了ブロック699に渡す。コンテキスト共有マップは、様々な変換について予め規定されており、共有パターンは、significant_coeff_flagまたはlast_significant_coeff_flagで異なることがある。
図7を参照すると、有意性マップを復号する従来の方法の全体が、参照番号700で示してある。方法700は、制御を機能ブロック720に渡す開始ブロック710を含む。機能ブロック720では、変換の既定のコンテキスト共有マップを読み取り、制御を機能ブロック730に渡す。機能ブロック730では、有意性マップを復号し、制御を終了ブロック799に渡す。復号器は、対応するコンテキスト共有マップを使用して、有意性マップを復号する。
<提案する方法-コンテキスト共有マップの生成を統一する>
KTAソフトウェアでは、32×32および64×64のマクロブロック・サイズがサポートされる。32×32ブロックでは、既存のMPEG-4 AVC規格の動きパーティションサイズ(16×16、16×8、8×16、8×8、8×4、4×8および4×4)に加えて、32×32、32×16および16×32個のパーティションを用いたインター符号化も使用可能である。変換が大きい方が、高精細度ビデオのより滑らかなコンテンツをより良質に捕捉することができる。インター・ピクチャでは、輝度成分の4×4変換および8×8変換に加えて、16×16変換、16×8変換および8×16変換が使用される。具体的には、サイズ16×16、16×8および8×16の各動きパーティションについて、4×4変換および8×8変換に加えて、サイズ16×16、16×8および8×16の変換を使用することができる。16×16より大きな動きパーティションについては、4×4変換および8×8変換に加えて、16×16変換が使用される。
新たに導入された変換(16×8、8×16および16×16)の変換係数の有意性マップを符号化するために、変換ごとに別個のコンテキスト共有マップを設計する。例えば、16×16変換のコンテキスト共有のパターンは、ほぼ8×8変換のアップサンプリング・バージョンである。変換では、通常、走査順序の最初のいくつかの係数にエネルギーを集中させるので、このようなコンテキスト共有は、変換係数分布に適さないことがある。さらに、このようなコンテキスト共有では、変換ごとにマップを記憶する必要がある。
発明者等は、符号化器および/または復号器の設計を簡略にするために、コンテキスト共有マップの生成を統一することを提案する。一実施形態では、発明者等は、走査順序(例えばジグザグの走査順序)に従って、2D変換係数ブロックを1D変換係数配列に変換する。変換係数位置xに応じて、発明者等は、規則F(x)に従ってコンテキストを割り当てる。この規則は、全ての変換について一貫している。例えば、以下のような規則である。
Figure 2023058526000003

ここで、Nは、コンテキストの数である。例えば、N=15であるときには、15個のコンテキストがある。
この規則を適用してコンテキスト共有マップを生成するときには、変換ごとに別個のマップを設計する必要がなく、複数の変換に容易に拡張することができる。符号化器および復号器の両方が同じ規則を認識し、使用する。
図8を参照すると、有意性マップを符号化する例示的な方法の全体が、参照番号800で示してある。方法800は、制御を機能ブロック820に渡す開始ブロック810を含む。機能ブロック820では、規則に基づいて変換のコンテキスト共有マップを生成し、制御を機能ブロック830に渡す。機能ブロック830では、有意性マップを符号化し、制御を終了ブロック899に渡す。機能ブロック820に関しては、変換のコンテキスト共有マップを生成する規則は、例えば、既定の走査順序(例えばジグザグの走査順序)の最初のN個の係数位置に対して1つの別のコンテキストを割り当て、それ以外の全ての係数位置に1つのコンテキストを共有させるものとすることができる。
図9を参照すると、有意性マップを復号する例示的な方法の全体が、参照番号900で示してある。方法900は、制御を機能ブロック920に渡す開始ブロック910を含む。機能ブロック920では、規則に基づいて変換のコンテキスト共有マップを生成し、制御を機能ブロック930に渡す。機能ブロック930では、有意性マップを復号し、制御を終了ブロック999に渡す。機能ブロック920に関しては、変換のコンテキスト共有マップを生成する規則は、符号化器で使用されるものと同じである。この規則は、例えば、既定の走査順序(例えばジグザグの走査順序)の最初のN個の係数位置に対して1つの別のコンテキストを割り当て、それ以外の全ての係数位置に1つのコンテキストを共有させるものとすることができる。
<変形>
本発明の原理の一実施形態では、コンテキスト共有マップを生成する規則は、シーケンス、ピクチャ解像度、量子化パラメータなどによって変わってもよい。例えば、発明者等は、F(x)を以下のように変形させることができる。
Figure 2023058526000004
発明者等は、シンタックスにおいてどの規則を使用するかを示すことを提案する。一実施形態では、符号化器および復号器の両方が規則を認識している。このような場合には、符号化器は、ビットストリーム中のインデックスによってどの規則を使用するかを示す。この手法では、柔軟性がさらに高まる。
図10を参照すると、有意性マップを符号化する別の方法の全体が、参照番号1000で示してある。方法1000は、制御を機能ブロック1020に渡す開始ブロック1010を含む。機能ブロック1020では、コンテキスト共有マップを生成する規則を決定し、この規則をビットストリーム中で示し、制御を機能ブロック1030に渡す。機能ブロック1030では、この規則に基づいて変換のコンテキスト共有マップを生成し、制御を機能ブロック1040に渡す。機能ブロック1020に関しては、規則は、係数が対応するビデオ・シーケンス、ピクチャ解像度、量子化パラメータなどに基づいて選択することができる。機能ブロック1030に関しては、変換のコンテキスト共有マップを生成する規則は、例えば、既定の走査順序の最初のN個の係数位置に対して1つの別のコンテキストを割り当て、それ以外の全ての係数位置に1つのコンテキストを共有させるものとすることができる。
図11を参照すると、有意性マップを復号する別の例示的な方法の全体が、参照番号1100で示してある。方法1100は、制御を機能ブロック1120に渡す開始ブロック1110を含む。機能ブロック1120では、コンテキスト共有マップを生成する規則を復号し、制御を機能ブロック1130に渡す。機能ブロック1130では、この規則に基づいて変換のコンテキスト共有マップを生成し、制御を機能ブロック1140に渡す。機能ブロック1140では、有意性マップを復号し、制御を終了ブロック1199に渡す。機能ブロック1130に関しては、変換のコンテキスト共有マップを生成する規則は、例えば、既定の走査順序の最初のN個の係数位置に対して1つの別のコンテキストを割り当て、それ以外の全ての係数位置に1つのコンテキストを共有させるものとすることができる。
<シンタックス>
発明者等が提案する方法は、例えばシーケンス・パラメータ・セット(SPS)またはピクチャ・パラメータ・セット(PPS)を介してコンテキスト共有マップを生成する規則を選択する柔軟性をもたらす。表1は、本発明の原理の一実施形態による、ピクチャ・パラメータ・セットで使用される例示的なシンタックスを示している。シーケンス・パラメータ・セットなど(ただしこれに限定されない)、その他のシンタックス・レベルでも同様のシンタックスを適用することができる。
Figure 2023058526000005
表1に示すシンタックス要素のセマンティクスは、以下の通りである。 significance_map_context_ruleは、有意性マップを符号化するためのコンテキスト共有マップを生成するために適用される特定の規則を指定する。
次に、一部については上記で既に触れているが、本発明の多くの付随的な利点/特徴のいくつかについて述べる。例えば、1つの利点/特徴は、ピクチャの少なくとも一部分の複数の変換係数を符号化するビデオ符号化器を有する装置である。変換係数は、複数の変換を用いて得られる。これらの変換係数に対して、統一された規則に基づいて、1つまたは複数のコンテキスト共有マップが生成される。これらの1つまたは複数のコンテキスト共有マップは、上記の複数の変換のうちの少なくとも2つの異なる変換から得られる変換係数のうちの少なくとも一部の間で共有される少なくとも1つのコンテキストを提供するものである。
別の利点/特徴は、ビデオ符号化器を有する上述の装置であって、変換係数が、2次元変換係数であり、統一された規則が、走査順序に従った2次元変換係数の1次元配列へのマッピング、および変換係数のうちの最初のN個の係数の別個のコンテキストへの割り当てを指定する装置である。
さらに別の利点/特徴は、上述した、変換係数が2次元変換係数であり、統一された規則が走査順序に従った2次元変換係数の1次元配列へのマッピング、および変換係数のうちの最初のN個の係数の別個のコンテキストへの割り当てを指定する、ビデオ符号化器を有する装置であって、変換係数のうちの残りの係数が、単一のコンテキストに割り当てられる、装置である。
さらに、別の利点/特徴は、上述した、変換係数が2次元変換係数であり、統一された規則が走査順序に従った2次元変換係数の1次元配列へのマッピングおよび変換係数のうちの最初のN個の係数の別個のコンテキストへの割り当てを指定する、ビデオ符号化器を有する装置であって、走査順序がジグザグの走査順序である、装置である。
さらに、別の利点/特徴は、ビデオ符号化器を有する上述の装置であって、変換係数が、1つの結果ビットストリームに符号化され、複数の規則が、上記の統一された規則の候補として用いられ、上記の統一された規則が、上記の結果ビットストリーム中で示される、装置である。
また、別の利点/特徴は、ビデオ符号化器を有する上述の装置であって、上記の統一された規則が、変換係数が対応するビデオ・シーケンス、ピクチャ解像度および量子化パラメータによって変わる少なくとも2つの統一された規則を含む、装置である。
本発明の原理の上記その他の特徴および利点は、当業者であれば、本明細書の教示に基づいて容易に確認することができる。本発明の原理の教示は、ハードウェア、ソフトウェア、ファームウェア、特殊目的プロセッサ、またはそれらの組合せの様々な形態で実施することができることを理解されたい。
本発明の原理の教示は、ハードウェアとソフトウェアの組合せとして実施されることが最も好ましい。さらに、ソフトウェアは、プログラム記憶装置に有形に具体化されたアプリケーション・プログラムとして実施することができる。アプリケーション・プログラムは、任意の適当なアーキテクチャを備える機械にアップロードし、この機械によって実行することができる。この機械は、1つまたは複数の中央処理装置(「CPU」)、ランダム・アクセス・メモリ(「RAM」)および入出力(「I/O」)インタフェースなどのハードウェアを有するコンピュータ・プラットフォームで実施されることが好ましい。コンピュータ・プラットフォームは、オペレーティング・システムおよびマイクロ命令コードも備えることができる。本明細書に記載する様々なプロセスおよび機能は、CPUによって実行することができる、マイクロ命令コードの一部またはアプリケーション・プログラムの一部あるいはそれらの任意の組合せの何れかにすることができる。さらに、追加のデータ記憶装置や印刷装置など、その他の様々な周辺装置をコンピュータ・プラットフォームに接続することもできる。
さらに、添付の図面に示すシステム構成要素および方法の一部はソフトウェアで実施することが好ましいので、システム構成要素間またはプロセス機能ブロック間の実際の接続は、本発明の原理をプログラミングする方法によって異なっていてもよいことも理解されたい。本明細書の教示があれば、当業者なら、本発明の原理の上記の実施態様または構成およびそれらと同様の実施態様または構成を思いつくことができるであろう。
本明細書では、添付の図面を参照して例示的な実施形態について述べたが、本発明の原理は、これらの具体的な実施形態に限定されるわけではなく、当業者なら、本発明の原理の範囲または趣旨を逸脱することなく様々な変更および修正をそれらの実施形態に加えることができることを理解されたい。そうした変更および修正は全て、添付の特許請求の範囲に記載する本発明の原理の範囲に含まれるものとする。

Claims (25)

  1. 複数の変換を用いて得られる、ピクチャの少なくとも一部分の複数の変換係数を符号化するビデオ符号化器(400)であって、統一された規則に基づいて前記変換係数に対して1つまたは複数のコンテキスト共有マップを生成し、前記1つまたは複数のコンテキスト共有マップが、前記複数の変換のうちの少なくとも2つの異なる変換から得られる前記変換係数のうちの少なくとも一部の間で共有される少なくとも1つのコンテキストを提供する、前記ビデオ符号化器(400)を備える装置。
  2. 前記変換係数が、2次元変換係数であり、前記統一された規則が、走査順序に従った前記2次元変換係数の1次元配列へのマッピング、および前記変換係数のうちの最初のN個の係数の別個のコンテキストへの割り当てを指定する、請求項1に記載の装置。
  3. 前記変換係数のうちの残りの係数が、単一のコンテキストに割り当てられる、請求項2に記載の装置。
  4. 前記走査順序が、ジグザグの走査順序である、請求項2に記載の装置。
  5. 前記変換係数が、1つの結果ビットストリームに符号化され、複数の規則が前記統一された規則の候補として用いられ、前記統一された規則が、前記結果ビットストリーム中で示される、請求項1に記載の装置。
  6. 前記統一された規則が、前記変換係数が対応するビデオ・シーケンス、ピクチャ解像度および量子化パラメータによって変わる少なくとも2つの統一された規則を含む、請求項1に記載の装置。
  7. ビデオ符号化器における方法であって、
    複数の変換を用いて得られる、ピクチャの少なくとも一部分の複数の変換係数を符号化するステップであって、統一された規則に基づいて前記変換係数に対して1つまたは複数のコンテキスト共有マップを生成し、前記1つまたは複数のコンテキスト共有マップが、前記複数の変換のうちの少なくとも2つの異なる変換から得られる前記変換係数のうちの少なくとも一部の間で共有される少なくとも1つのコンテキストを提供する、前記ステップ(800、1000)を含む、前記方法。
  8. 前記変換係数が、2次元変換係数であり、前記統一された規則が、走査順序に従った前記2次元変換係数の1次元配列へのマッピング、および前記変換係数のうちの最初のN個の係数の別個のコンテキストへの割り当てを指定する(820)、請求項7に記載の方法。
  9. 前記変換係数のうちの残りの係数が、単一のコンテキストに割り当てられる(820)、請求項8に記載の方法。
  10. 前記走査順序が、ジグザグの走査順序である(820)、請求項8に記載の方法。
  11. 前記変換係数が、1つの結果ビットストリームに符号化され、複数の規則が前記統一された規則の候補として用いられ、前記統一された規則が、前記結果ビットストリーム中で示される(1020)、請求項7に記載の方法。
  12. 前記統一された規則が、前記変換係数が対応するビデオ・シーケンス、ピクチャ解像度および量子化パラメータによって変わる少なくとも2つの統一された規則を含む(1020)、請求項7に記載の方法。
  13. 複数の変換を用いて得られる、ピクチャの少なくとも一部分の複数の変換係数を復号するビデオ復号器であって、統一された規則に基づいて前記変換係数に対して1つまたは複数のコンテキスト共有マップを生成し、前記1つまたは複数のコンテキスト共有マップが、前記複数の変換のうちの少なくとも2つの異なる変換から得られる前記変換係数のうちの少なくとも一部の間で共有される少なくとも1つのコンテキストを提供する、前記ビデオ復号器(500)を備える装置。
  14. 前記変換係数が、2次元変換係数であり、前記統一された規則が、走査順序に従った前記2次元変換係数の1次元配列へのマッピング、および前記変換係数のうちの最初のN個の係数の別個のコンテキストへの割り当てを指定する、請求項13に記載の装置。
  15. 前記変換係数のうちの残りの係数が、単一のコンテキストに割り当てられる、請求項14に記載の装置。
  16. 前記走査順序が、ジグザグの走査順序である、請求項14に記載の装置。
  17. 前記変換係数が、1つのビットストリームから復号され、複数の規則が前記統一された規則の候補として用いられ、前記統一された規則が、前記ビットストリームから決定される、請求項13に記載の装置。
  18. 前記統一された規則が、前記変換係数が対応するビデオ・シーケンス、ピクチャ解像度および量子化パラメータによって変わる少なくとも2つの統一された規則を含む、請求項13に記載の装置。
  19. ビデオ復号器における方法であって、
    複数の変換を用いて得られる、ピクチャの少なくとも一部分の複数の変換係数を復号するステップであって、統一された規則に基づいて前記変換係数に対して1つまたは複数のコンテキスト共有マップを生成し、前記1つまたは複数のコンテキスト共有マップが、前記複数の変換のうちの少なくとも2つの異なる変換から得られる前記変換係数のうちの少なくとも一部の間で共有される少なくとも1つのコンテキストを提供する、前記ステップ(900、1100)を含む、前記方法。
  20. 前記変換係数が、2次元変換係数であり、前記統一された規則が、走査順序に従った前記2次元変換係数の1次元配列へのマッピング、および前記変換係数のうちの最初のN個の係数の別個のコンテキストへの割り当てを指定する(920)、請求項19に記載の方法。
  21. 前記変換係数のうちの残りの係数が、単一のコンテキストに割り当てられる(920)、請求項20に記載の方法。
  22. 前記走査順序が、ジグザグの走査順序である(920)、請求項20に記載の方法。
  23. 前記変換係数が、1つのビットストリームから復号され、複数の規則が前記統一された規則の候補として用いられ、前記統一された規則が、前記ビットストリームから決定される(1120)、請求項19に記載の方法。
  24. 前記統一された規則が、前記変換係数が対応するビデオ・シーケンス、ピクチャ解像度および量子化パラメータによって変わる少なくとも2つの統一された規則を含む(1120)、請求項19に記載の方法。
  25. 符号化されたビデオ信号データを有するコンピュータ可読記憶媒体であって、複数の変換を用いて得られる、ピクチャの少なくとも一部分についての符号化された複数の変換係数であって、統一された規則に基づいて前記変換係数に対して1つまたは複数のコンテキスト共有マップが生成され、前記1つまたは複数のコンテキスト共有マップが、前記複数の変換のうちの少なくとも2つの異なる変換から得られる前記変換係数のうちの少なくとも一部の間で共有される少なくとも1つのコンテキストを提供する、前記変換係数を含む、前記コンピュータ可読記憶媒体。
JP2023009137A 2010-05-12 2023-01-25 統一された有意性マップ符号化方法および装置 Active JP7445030B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US33380810P 2010-05-12 2010-05-12
US61/333,808 2010-05-12
JP2020089007A JP2020145729A (ja) 2010-05-12 2020-05-21 統一された有意性マップ符号化方法および装置

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2020089007A Division JP2020145729A (ja) 2010-05-12 2020-05-21 統一された有意性マップ符号化方法および装置

Publications (2)

Publication Number Publication Date
JP2023058526A true JP2023058526A (ja) 2023-04-25
JP7445030B2 JP7445030B2 (ja) 2024-03-06

Family

ID=44343272

Family Applications (6)

Application Number Title Priority Date Filing Date
JP2013510077A Active JP5812448B2 (ja) 2010-05-12 2011-05-11 統一された有意性マップ符号化方法および装置
JP2015163333A Active JP6100847B2 (ja) 2010-05-12 2015-08-21 統一された有意性マップ符号化方法および装置
JP2017032207A Active JP6351773B2 (ja) 2010-05-12 2017-02-23 統一された有意性マップ符号化方法および装置
JP2018107650A Active JP6708700B2 (ja) 2010-05-12 2018-06-05 統一された有意性マップ符号化方法および装置
JP2020089007A Ceased JP2020145729A (ja) 2010-05-12 2020-05-21 統一された有意性マップ符号化方法および装置
JP2023009137A Active JP7445030B2 (ja) 2010-05-12 2023-01-25 統一された有意性マップ符号化方法および装置

Family Applications Before (5)

Application Number Title Priority Date Filing Date
JP2013510077A Active JP5812448B2 (ja) 2010-05-12 2011-05-11 統一された有意性マップ符号化方法および装置
JP2015163333A Active JP6100847B2 (ja) 2010-05-12 2015-08-21 統一された有意性マップ符号化方法および装置
JP2017032207A Active JP6351773B2 (ja) 2010-05-12 2017-02-23 統一された有意性マップ符号化方法および装置
JP2018107650A Active JP6708700B2 (ja) 2010-05-12 2018-06-05 統一された有意性マップ符号化方法および装置
JP2020089007A Ceased JP2020145729A (ja) 2010-05-12 2020-05-21 統一された有意性マップ符号化方法および装置

Country Status (6)

Country Link
US (6) US9793921B2 (ja)
EP (2) EP2569944A1 (ja)
JP (6) JP5812448B2 (ja)
KR (6) KR102574591B1 (ja)
CN (1) CN102884792B (ja)
WO (1) WO2011142817A1 (ja)

Families Citing this family (30)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102574591B1 (ko) * 2010-05-12 2023-09-06 인터디지털 매디슨 페턴트 홀딩스 에스에이에스 통합된 유효성 맵 코딩을 위한 방법 및 장치
US8902988B2 (en) * 2010-10-01 2014-12-02 Qualcomm Incorporated Zero-out of high frequency coefficients and entropy coding retained coefficients using a joint context model
ES2797423T3 (es) * 2011-06-28 2020-12-02 Samsung Electronics Co Ltd Procedimiento de codificación y decodificación de vídeo usando codificación aritmética con una señalización bidimensional del último coeficiente significativo
US9756360B2 (en) * 2011-07-19 2017-09-05 Qualcomm Incorporated Coefficient scanning in video coding
US20130101047A1 (en) * 2011-10-19 2013-04-25 Sony Corporation Context reduction of significance map coding of 4x4 and 8x8 transform coefficient in hm4.0
EP2773047A3 (en) * 2011-10-24 2015-01-14 BlackBerry Limited Significance map encoding and decoding using partition selection
US8891630B2 (en) 2011-10-24 2014-11-18 Blackberry Limited Significance map encoding and decoding using partition set based context assignment
US10390046B2 (en) * 2011-11-07 2019-08-20 Qualcomm Incorporated Coding significant coefficient information in transform skip mode
US9154792B2 (en) 2011-11-08 2015-10-06 Qualcomm Incorporated Progressive coding of position of last significant coefficient
US9357185B2 (en) * 2011-11-08 2016-05-31 Qualcomm Incorporated Context optimization for last significant coefficient position coding
WO2013102380A1 (en) * 2012-01-03 2013-07-11 Mediatek Inc. Method and apparatus for block-based significance map and significance group flag context selection
EP2673954A4 (en) * 2012-01-12 2015-08-12 Mediatek Inc METHOD AND DEVICE FOR UNIFYING CONTEXT-BASED CARD SELECTIONS
US20130182772A1 (en) * 2012-01-13 2013-07-18 Qualcomm Incorporated Determining contexts for coding transform coefficient data in video coding
EP2805495B1 (en) * 2012-01-20 2023-07-19 Google Technology Holdings LLC Devices and methods for context reduction in last significant coefficient position coding
US9106918B2 (en) 2012-01-20 2015-08-11 Sony Corporation Coefficient coding harmonization in HEVC
KR20160034424A (ko) * 2012-01-20 2016-03-29 소니 주식회사 유효성 맵 코딩의 복잡성 감소
WO2013109997A1 (en) 2012-01-21 2013-07-25 General Instrument Corporation Method of determining binary codewords for transform coefficients
US9479780B2 (en) 2012-02-01 2016-10-25 Google Technology Holdings LLC Simplification of significance map coding
EP2810440A1 (en) * 2012-02-04 2014-12-10 General Instrument Corporation Devices and methods for context reduction in last significant coefficient position coding
US9237344B2 (en) * 2012-03-22 2016-01-12 Qualcomm Incorporated Deriving context for last position coding for video coding
WO2013155663A1 (en) * 2012-04-16 2013-10-24 Mediatek Singapore Pte. Ltd. Methods and apparatuses of context reduction for significance flag coding
US9124872B2 (en) * 2012-04-16 2015-09-01 Qualcomm Incorporated Coefficient groups and coefficient coding for coefficient scans
KR102257542B1 (ko) 2012-10-01 2021-05-31 지이 비디오 컴프레션, 엘엘씨 향상 레이어에서 변환 계수 블록들의 서브블록-기반 코딩을 이용한 스케일러블 비디오 코딩
US9432696B2 (en) 2014-03-17 2016-08-30 Qualcomm Incorporated Systems and methods for low complexity forward transforms using zeroed-out coefficients
US9516345B2 (en) 2014-03-17 2016-12-06 Qualcomm Incorporated Systems and methods for low complexity forward transforms using mesh-based calculations
US9781424B2 (en) 2015-01-19 2017-10-03 Google Inc. Efficient context handling in arithmetic coding
US10448058B2 (en) * 2015-05-21 2019-10-15 Qualcomm Incorporated Grouping palette index at the end and index coding using palette size and run value
PL3416658T3 (pl) 2016-02-15 2023-09-04 Kyoto Prefectural Public University Corporation Funkcjonalna ludzka komórka śródb‎łonka rogówki i jej zastosowanie
JP7187182B2 (ja) 2018-06-11 2022-12-12 キヤノン株式会社 データ生成装置、方法およびプログラム
US11922664B2 (en) * 2021-10-04 2024-03-05 Tencent America LLC Method and apparatus of adaptive sampling for mesh compression by decoders

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6778709B1 (en) * 1999-03-12 2004-08-17 Hewlett-Packard Development Company, L.P. Embedded block coding with optimized truncation
US7023922B1 (en) * 2000-06-21 2006-04-04 Microsoft Corporation Video coding system and method using 3-D discrete wavelet transform and entropy coding with motion information
AU2002213713A1 (en) * 2000-10-24 2002-05-06 Eyeball Networks Inc. Dct-based scalable video compression
DE50305419D1 (de) * 2002-05-02 2006-11-30 Fraunhofer Ges Forschung Kodierung und Dekodierung von Transformationskoeffizienten in Bild- oder Videokodierern
US7715480B2 (en) * 2003-10-17 2010-05-11 Mitsubishi Electric Research Laboratories, Inc. Video encoding with motion-selective wavelet transform
US7599435B2 (en) * 2004-01-30 2009-10-06 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Video frame encoding and decoding
KR100736104B1 (ko) 2006-04-06 2007-07-06 삼성전자주식회사 독립적 파싱을 지원하는 비디오 코딩 방법 및 장치
KR101356733B1 (ko) 2007-03-07 2014-02-05 삼성전자주식회사 컨텍스트 기반 적응적 이진 산술 부호화, 복호화 방법 및장치
US7813567B2 (en) 2007-04-26 2010-10-12 Texas Instruments Incorporated Method of CABAC significance MAP decoding suitable for use on VLIW data processors
US8891615B2 (en) * 2008-01-08 2014-11-18 Qualcomm Incorporated Quantization based on rate-distortion modeling for CABAC coders
PT3244612T (pt) * 2010-04-13 2018-11-14 Ge Video Compression Llc Codificação de mapas de significância e blocos de coeficientes de transformada
KR102574591B1 (ko) * 2010-05-12 2023-09-06 인터디지털 매디슨 페턴트 홀딩스 에스에이에스 통합된 유효성 맵 코딩을 위한 방법 및 장치

Also Published As

Publication number Publication date
KR20130070595A (ko) 2013-06-27
US11942969B2 (en) 2024-03-26
KR20210124529A (ko) 2021-10-14
EP4175184A1 (en) 2023-05-03
US10305510B2 (en) 2019-05-28
JP2018174537A (ja) 2018-11-08
US9793921B2 (en) 2017-10-17
JP6708700B2 (ja) 2020-06-10
JP7445030B2 (ja) 2024-03-06
CN102884792B (zh) 2016-08-17
WO2011142817A1 (en) 2011-11-17
JP2017127005A (ja) 2017-07-20
CN102884792A (zh) 2013-01-16
KR20230129624A (ko) 2023-09-08
KR20200073295A (ko) 2020-06-23
KR20220104301A (ko) 2022-07-26
KR102574591B1 (ko) 2023-09-06
JP2013526799A (ja) 2013-06-24
US20130058418A1 (en) 2013-03-07
JP2020145729A (ja) 2020-09-10
KR101983380B1 (ko) 2019-05-28
KR102423182B1 (ko) 2022-07-21
US20180076826A1 (en) 2018-03-15
US20190334548A1 (en) 2019-10-31
US20210167793A1 (en) 2021-06-03
US11671112B2 (en) 2023-06-06
JP6351773B2 (ja) 2018-07-04
JP5812448B2 (ja) 2015-11-11
JP2016026425A (ja) 2016-02-12
US20230261672A1 (en) 2023-08-17
EP2569944A1 (en) 2013-03-20
US20220200625A1 (en) 2022-06-23
US11177826B2 (en) 2021-11-16
JP6100847B2 (ja) 2017-03-22
US11309910B2 (en) 2022-04-19
KR102310816B1 (ko) 2021-10-13
KR102124149B1 (ko) 2020-06-18
KR20190058721A (ko) 2019-05-29

Similar Documents

Publication Publication Date Title
JP7445030B2 (ja) 統一された有意性マップ符号化方法および装置
JP2023040013A (ja) 適応ツリー選択を使用してバイナリ・セットをビデオ符号化およびビデオ復号する方法および装置
CN106105207B (zh) 用于编码/解码视频数据的方法和设备
JP6162150B2 (ja) ビデオコーディング用の残差4分木(rqt)コーディング
KR20120065327A (ko) 2진 세트들을 인코딩 및 디코딩하기 위해 트리 구조들을 재이용하는 방법 및 장치
CN109417622A (zh) 使用简单本地预测器的改进的有效性标志译码的方法和装置

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230221

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20230221

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20240126

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20240222

R150 Certificate of patent or registration of utility model

Ref document number: 7445030

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150