JP7046220B2 - 小ブロックの予測と変換のための方法、装置、及びプログラム - Google Patents

小ブロックの予測と変換のための方法、装置、及びプログラム Download PDF

Info

Publication number
JP7046220B2
JP7046220B2 JP2020555778A JP2020555778A JP7046220B2 JP 7046220 B2 JP7046220 B2 JP 7046220B2 JP 2020555778 A JP2020555778 A JP 2020555778A JP 2020555778 A JP2020555778 A JP 2020555778A JP 7046220 B2 JP7046220 B2 JP 7046220B2
Authority
JP
Japan
Prior art keywords
block
intra
video
mode
sample
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2020555778A
Other languages
English (en)
Other versions
JP2021518088A (ja
Inventor
ジャオ,シン
リ,シアン
リィウ,シャン
ジャオ,リアン
Original Assignee
テンセント・アメリカ・エルエルシー
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by テンセント・アメリカ・エルエルシー filed Critical テンセント・アメリカ・エルエルシー
Publication of JP2021518088A publication Critical patent/JP2021518088A/ja
Application granted granted Critical
Publication of JP7046220B2 publication Critical patent/JP7046220B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/44Decoders specially adapted therefor, e.g. video decoders which are asymmetric with respect to the encoder
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/11Selection of coding mode or of prediction mode among a plurality of spatial predictive coding modes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/132Sampling, masking or truncation of coding units, e.g. adaptive resampling, frame skipping, frame interpolation or high-frequency transform coefficient masking
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/149Data rate or code amount at the encoder output by estimating the code amount by means of a model, e.g. mathematical model or statistical model
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • H04N19/159Prediction type, e.g. intra-frame, inter-frame or bidirectional frame prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/186Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a colour or a chrominance component
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/593Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial prediction techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Algebra (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Pure & Applied Mathematics (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Description

参照による援用
本開示は、2018年5月2日に出願された米国仮出願第62/665,858号の「小ブロックの予測と変換」の優先権を主張し、その内容を全て参照により本明細書に組み込むものとする。
本開示は、一般にビデオ符号化に関する実施形態を説明する。
本明細書で提供される「背景技術」の説明は、本開示の内容を大まかに示すことを目的とする。本発明者の業績は、この背景技術に記載された範囲において、出願時に従来技術として通常見なされえない記載の態様と共に、明示的にも黙示的にも本開示に対する従来技術として認められない。
ビデオ符号化および復号は、動き補償を伴うイントラピクチャ予測を使用して実行されることができる。非圧縮デジタルビデオは一連のピクチャを含むことができ、各ピクチャは、例えば、1920×1080輝度サンプルと関連する彩度サンプルの空間次元を持っている。該一連のピクチャは、例えば毎秒60ピクチャまたは60Hzの固定または可変ピクチャレート(非公式にはフレームレートとも呼ばれる)を持つことができる。非圧縮ビデオには、顕著なビットレート要件がある。例えば、サンプルあたり8ビットでの1080p60 4:2:0ビデオ(60Hzフレームレートでの1920×1080輝度サンプル解像度)には、1.5Gbit/sに近い帯域幅が必要となる。このようなビデオを1時間使用するには、600GBytesを超えた記憶空間が必要である。
ビデオ符号化および復号の1つの目的は、圧縮によって入力ビデオ信号の冗長性を減らすことであり得る。圧縮は、前述の帯域幅または記憶空間の要件を、場合によっては2桁以上削減するのに役立つ。可逆圧縮と非可逆圧縮の両方、およびそれらの組み合わせを使用することができる。可逆圧縮とは、圧縮された元の信号から元の信号の正確なコピーを再構築できる技法を指す。非可逆圧縮を使用する場合、再構築された信号は元の信号と同一ではない可能性があるが、元の信号と再構築された信号の間の歪みは、再構築された信号を意図されたアプリケーションに役立てる程度に小さい。ビデオの場合、非可逆圧縮が広く採用されている。許容される歪みの量はアプリケーションによって異なる。例えば、特定のコンシューマストリーミングアプリケーションのユーザは、テレビ発行アプリケーションのユーザよりも高い歪みを許容できる。達成可能な圧縮率は、受け入れ可能/許容可能な歪みが大きいほど、圧縮率が高くなることを反映することができる。
ビデオエンコーダおよびデコーダは、例えば、動き補償、変換、量子化、およびエントロピー符号化を含むいくつかの広範なカテゴリからの技法を利用することができる。
ビデオコーデック技術は、イントラ符号化として知られる技法を含み得る。イントラ符号化では、サンプル値は、予め再構築された参照ピクチャからのサンプルまたは他のデータを参照せずに表される。一部のビデオコーデックでは、ピクチャは空間的にサンプルのブロックに細分される。サンプルのすべてのブロックがイントラモードで符号化されると、そのピクチャはイントラピクチャになる可能性がある。イントラピクチャとその独立したデコーダリフレッシュピクチャなどの派生物は、デコーダの状態をリセットするために使用できるため、符号化されたビデオビットストリームとビデオセッションの最初のピクチャとして、または静止画像として使用されることができる。イントラブロックのサンプルは変換にさらされることができ、変換係数はエントロピー符号化の前に量子化されることができる。イントラ予測は、事前変換領域でサンプル値を最小化する技法であり得る。場合によっては、変換後のDC値が小さく、AC係数が小さいほど、エントロピー符号化後のブロックを表すために所定の量子化ステップサイズで必要なビットが少なくなる。
例えばMPEG―2世代符号化技術から知られているような従来のイントラ符号化は、イントラ予測を使用しない。しかしながら、いくつかのより新しいビデオ圧縮技術は、例えば、空間的に隣接し、デコード順に先行するデータブロックのエンコード/デコード中に得られた周囲のサンプルデータおよび/またはメタデータから試みる技法を含む。そのような技法は、以降、「イントラ予測」技法と呼ばれる。なお、少なくともいくつかのケースでは、イントラ予測は、再構成中の現在ピクチャからの参照データのみを使用し、参照ピクチャからの参照データを使用しない。
イントラ予測はさまざまな形態で存在し得る。そのような技法の2つ以上が所定のビデオ符号化技術に使用できる場合、使用された技法はイントラ予測モードで符号化されることができる。場合によっては、モードはサブモードやパラメータを有することができ、それらを個別に符号化するか、もしくはモードコードワードに含めることができる。どのコードワードが所定のモード/サブモード/パラメータの組み合わせに使用されるかは、イントラ予測による符号化効率ゲインに影響を与える可能性があるので、エントロピー符号化技術がコードワードをビットストリームに変換するために使用できる。
イントラ予測の特定のモードはH.264で導入され、H.265で改良され、さらに共同探索モデル(JEM)、多用途ビデオ符号化(VVC)、およびベンチマークセット(BMS)などのより新しい符号化技術で改良された。予測子ブロックは、すでに利用可能なサンプルに属する隣接サンプル値を使用して形成されることができる。隣接サンプルのサンプル値は、方向に従って予測子ブロックにコピーされる。使用された方向への参照は、ビットストリームに符号化されるか、もしくはそれ自体を予測され得る。
ビデオ符号化技術が発展するにつれて、予測可能な方向の数は増加した。H.264(2003年)では、9通りの異なる方向を表すことができた。H.265(2013年)で33通りに増加し、JEM/VVC/BMSは開示時に最大65通りの方向をサポートできる。最も見込みのある方向を識別するための実験が行われ、特定のエントロピー符号化の技法は、数が少ないビットで見込みの高い方向を表すために使用され、見込みの低い方向に対する特定のペナルティを容認する。さらに、方向自体は、隣接する、すでにデコードされたブロックで使用される隣接方向から予測される場合がある。
方向を表す符号化されたビデオビットストリーム内のイントラ予測方向ビットのマッピングは、ビデオ符号化技術ごとに異なる可能性があり、また、例えば、イントラ予測モードへの予測方向のコードワードへの単純な直接マッピングから、最も可能性の高いモードや類似した技法を含む複雑な適応方式までの範囲とすることができる。しかしながら、すべての場合において、他の特定の方向よりも統計的にビデオコンテンツにおいて発生する可能性が低い特定の方向が存在する可能性がある。ビデオ圧縮の目的は冗長性の削減であるため、適切に機能するビデオ符号化技術では、これらの可能性の低い方向は、可能性の高い方向よりも多くのビット数で表される。
いくつかの符号化規格では、ピクチャは、符号化ツリーユニット(CTU)として表されてもよい。CTUは、様々な局所特性に適応するために符号化ツリーとして示される4分木構造を使用することによって、符号化ユニット(CU)に分割され得る。インターピクチャ(時間的)またはイントラピクチャ(空間的)予測のどちらを使用してピクチャ領域を符号化するかは、CUレベルで決定される。各CUは、PU分割タイプに従って、1つ、2つ、または4つの予測ユニット(PU)にさらに分けられることができる。1つのPU内で、同じ予測処理が適用され、関連情報がPU単位でデコーダに送信される。PU分割タイプに基づく予測処理を適用して残差ブロックを取得した後、CUは、CUの符号化ツリーと同様の別の四分木構造に従って変換ユニット(TU)に分割されることができる。
可変ブロックサイズに対して予測処理を実行してもよい。しかしながら、小ブロックは、より大きなブロックサイズを有するブロックと同じ数のイントラ予測方向を必要としない。さらに、小ブロックの予測は、隣接ブロックの再構成の後に実行されなければならないので、小ブロックの処理は、エンコーダまたはデコーダのハードウェア実施に追加の負担をかける可能性がある。加えて、小ブロックのモード決定を実行する負担のせいで、小ブロックの処理は、エンコーダまたはデコーダのソフトウェア実施に追加の負担をかける可能性がある。
本開示の例示的な実施形態は、ビデオデコーダ用のビデオデコード方法を含む。該方法は、前記ビデオデコーダの処理回路により、彩度(chroma)ブロックのブロックサイズがブロックサイズ閾値以下であるか否かを判定するステップを含む。該方法は、前記ビデオデコーダの処理回路により、前記彩度ブロックの前記ブロックサイズが前記ブロックサイズ閾値よりも大きいとの判定に応じて、複数のイントラ予測モードから前記彩度ブロック用のイントラ予測モードを選択するステップをさらに含む。該方法は、前記ビデオデコーダの処理回路により、前記彩度ブロックの前記ブロックサイズが前記ブロックサイズ閾値以下であるとの判定に応じて、前記複数のイントラ予測モードのサブセットから前記彩度ブロック用の前記イントラ予測モードを選択するステップをさらに含む。該方法は、前記ビデオデコーダの処理回路により、選択された前記イントラ予測モードで取得された彩度サンプルに基づいて、前記彩度ブロックのイントラ予測を実行するステップをさらに含む。
本開示の例示的な実施形態は、ビデオデコードのためのビデオデコーダを含む。ビデオデコーダは、彩度ブロックのブロックサイズがブロックサイズ閾値以下であるか否かを判定するように構成される処理回路を備える。該処理回路は、さらに、前記彩度ブロックの前記ブロックサイズが前記ブロックサイズ閾値よりも大きいとの判定に応じて、複数のイントラ予測モードから前記彩度ブロック用のイントラ予測モードを選択するように構成される。該処理回路は、さらに、前記彩度ブロックの前記ブロックサイズが前記ブロックサイズ閾値以下であるとの判定に応じて、前記複数のイントラ予測モードのサブセットから前記彩度ブロック用の前記イントラ予測モードを選択するように構成される。該処理回路は、さらに、選択された前記イントラ予測モードで取得された彩度サンプルに基づいて、前記彩度ブロックのイントラ予測を実行するように構成される。
本開示の例示的な実施形態は、ビデオデコーダのプロセッサに前記方法を実行させるコンピュータプログラムを含む。該方法は、前記ビデオデコーダのプロセッサにより、彩度ブロックのブロックサイズがブロックサイズ閾値以下であるか否かを判定するステップを含む。該方法は、前記ビデオデコーダのプロセッサにより、前記彩度ブロックの前記ブロックサイズが前記ブロックサイズ閾値よりも大きいとの判定に応じて、複数のイントラ予測モードから前記彩度ブロック用のイントラ予測モードを選択するステップをさらに含む。該方法は、前記ビデオデコーダのプロセッサにより、前記彩度ブロックの前記ブロックサイズが前記ブロックサイズ閾値以下であるとの判定に応じて、前記複数のイントラ予測モードのサブセットから前記彩度ブロック用の前記イントラ予測モードを選択するステップをさらに含む。該方法は、前記ビデオデコーダのプロセッサにより、選択された前記イントラ予測モードで取得された彩度サンプルに基づいて、前記彩度ブロックのイントラ予測を実行するステップをさらに含む。
開示された主題のさらなる特徴、本質、および様々な利点は、以下の詳細な説明および添付の図面からより明らかになるであろう。
一実施形態による通信システム(100)の概略ブロック図である。 一実施形態による通信システム(200)の概略ブロック図である。 一実施形態によるデコーダの概略ブロック図である。 一実施形態によるエンコーダの概略ブロック図である。 他の実施形態によるエンコーダのブロック図を示す。 他の実施形態によるデコーダのブロック図を示す。 例示的なイントラ予測モードの概略図である。 35通りの予測モードのための様々な角度モードを示している。 35通りの予測モードのための様々な角度モードを示している。 67通りの予測モードのための様々な角度モードを示している。 67通りの予測モードのための様々な角度モードを示している。 クロスコンポーネント線形モデル(CCLM)予測モードの導出に使用されるサンプルの例示的な位置を示している。 クロスコンポーネント線形モデル(CCLM)予測モードの導出に使用されるサンプルの例示的な位置を示している。 エンコーダまたはデコーダによって実行される処理の実施形態を示している。 一実施形態によるコンピュータシステムの概略図である。
図1は、本開示の実施形態による通信システム(100)の簡略ブロック図を示している。通信システム(100)は、例えばネットワーク(150)を介して互いに通信可能な複数の端末装置を含む。例えば、通信システム(100)は、ネットワーク(150)を介して相互接続された第1の対の端末装置(110)および(120)を含む。図1の例では、第1の対の端末装置(110)および(120)は、データの単方向送信を実行する。例えば、端末装置(110)は、ネットワーク(150)を介して他の端末装置(120)へ送信するためにビデオデータ(例えば、端末装置(110)によってキャプチャされたビデオピクチャのストリーム)を符号化し得る。エンコードされたビデオデータは、1つ以上の符号化されたビデオビットストリームの形で送信されることができる。端末装置(120)は、ネットワーク(150)から符号化ビデオデータを受信し、符号化ビデオデータをデコードしてビデオピクチャを復元し、復元されたビデオデータに従ってビデオピクチャを表示することができる。単方向のデータ送信は、メディア供給アプリケーションなどで一般的である。
他の例では、通信システム(100)は、例えば、ビデオ会議中に発生し得る符号化ビデオデータの双方向送信を実行する第2の対の端末装置(130)および(140)を含む。データの双方向送信の場合、一例では、端末装置(130)および(140)のそれぞれは、ネットワーク(150)を介して端末装置(130)および(140)のうちの他方の端末装置へ送信するためにビデオデータ(例えば、端末装置によってキャプチャされたビデオピクチャのストリーム)を符号化し得る。端末装置(130)および(140)のそれぞれは、端末装置(130)および(140)のうちの他方の端末装置で送信された符号化ビデオデータを受信することができ、符号化ビデオデータをデコードしてビデオピクチャを復元することができ、復元されたビデオデータに従ってビデオピクチャをアクセス可能な表示装置に表示することができる。
図1の例では、端末装置(110)、(120)、(130)および(140)は、サーバ、パーソナルコンピュータおよびスマートフォンとして示され得るが、しかし、本開示の原理はこれに制限されることはない。本開示の実施形態は、ラップトップコンピュータ、タブレットコンピュータ、メディアプレーヤー、および/または専用のビデオ会議機器における用途を見出す。ネットワーク(150)は、例えば有線および/または無線通信ネットワークを含む、端末装置(110)、(120)、(130)および(140)間で符号化ビデオデータを伝達する任意の数のネットワークを表す。通信ネットワーク(150)は、回線交換および/またはパケット交換チャネルでデータを交換することができる。代表的なネットワークは、電気通信ネットワーク、ローカルエリアネットワーク、ワイドエリアネットワークおよび/またはインターネットを含む。本議論の目的のために、ネットワーク(150)のアーキテクチャおよびトポロジーは、以下で説明されない限り、本開示の動作にとって重要でないかもしれない。
図2は、開示された主題の適用の例として、ストリーミング環境におけるビデオエンコーダおよびビデオデコーダの配置を示している。開示された主題は、例えば、ビデオ会議、デジタルTV、および、CD、DVD、メモリスティックなどを含むデジタルメディアへの圧縮ビデオの記憶など、を含む他のビデオ対応アプリケーションに等しく適用可能である。
ストリーミングシステムは、例えば非圧縮のビデオピクチャ(202)のストリームを作成するデジタルカメラなどのビデオソース(201)を含むことができるキャプチャサブシステム(213)を含んでもよい。一例では、ビデオピクチャ(202)のストリームは、デジタルカメラによって取得されたサンプルを含む。エンコードされたビデオデータ(204)(又は符号化されたビデオビットストリーム)と比較して高データ量を強調するために太線で示されたビデオピクチャ(202)のストリームは、ビデオソース(201)に結合されたビデオエンコーダ(203)を含む電子デバイス(220)によって処理されることができる。ビデオエンコーダ(203)は、以下でより詳細に説明されるように、開示された主題の態様を可能にするか或いは実施するためのハードウェア、ソフトウェア、またはそれらの組み合わせを含むことができる。ビデオピクチャ(202)のストリームと比較してより低いデータ量を強調するために細い線で示された、エンコードされたビデオデータ(204)(またはエンコードされたビデオビットストリーム(204))は、将来使うためにストリーミングサーバ(205)に記憶されることができる。図2のクライアントサブシステム(206)および(208)のような1つ以上のストリーミングクライアントサブシステムは、ストリーミングサーバ(205)にアクセスして、エンコードされたビデオデータ(204)のコピー(207)および(209)を検索することができる。クライアントサブシステム(206)は、例えば、電子デバイス(230)におけるビデオデコーダ(210)を含むことができる。ビデオデコーダ(210)は、エンコードされたビデオデータの着信コピー(207)をデコードし、ディスプレイ(212)(例えば、表示画面)または他のレンダリングデバイス(示されていない)でレンダリングできるビデオピクチャ(211)の発信ストリームを作成する。一部のストリーミングシステムにおいて、エンコードされたビデオデータ(204)、(207)、および(209)(例えば、ビデオビットストリーム)は、特定のビデオ符号化/圧縮規格に従ってエンコードされることができる。これらの規格の例は、ITU-T勧告H.265を含む。一例では、開発中のビデオ符号化規格は、非公式的にヴァーサトゥルビデオ符号化またはVVCとして知られている。開示された主題は、VVCの文脈に使用され得る。
なお、電子デバイス(220)および(230)は、他の構成要素(図示せず)を含むことができる。例えば、電子デバイス(220)は、ビデオデコーダ(図示せず)を含むことができ、電子デバイス(230)は、ビデオエンコーダ(図示せず)を含むこともできる。
図3は、本開示の実施形態によるビデオデコーダ(310)のブロック図を示す。ビデオデコーダ(310)は、電子デバイス(330)に含まれることができる。電子デバイス(330)は、受信機(331)(例えば、受信回路)を含むことができる。ビデオデコーダ(310)は、図2の例におけるビデオデコーダ(210)の代わりに使用されることができる。
受信機(331)は、ビデオデコーダ(310)によってデコードされる1つ以上の符号化ビデオシーケンスを受信することができ、同一または別の実施形態では、一度に1つの符号化ビデオシーケンスを受信してもよく、各符号化ビデオシーケンスのデコードは、他の符号化ビデオシーケンスから独立している。符号化ビデオシーケンスは、エンコードされたビデオデータを記憶する記憶装置へのハードウェア/ソフトウェアリンクであり得るチャネル(301)から受信されることができる。受信機(331)は、それぞれの使用エンティティ(示されていない)に転送され得る他のデータ、例えば、符号化オーディオデータおよび/または補助データストリームとともに、エンコードされたビデオデータを受信し得る。受信機(331)は、符号化ビデオシーケンスを他のデータから分離することができる。ネットワークジッタを防止するために、バッファメモリ(315)は、受信機(331)とエントロピーデコーダ/パーサ(320)(以降、「パーサ(320)」)の間に結合されてもよい。特定の用途では、バッファメモリ(315)は、ビデオデコーダ(310)の一部である。他の場合、ビデオデコーダ(310)(示されていない)の外部に存在し得る。さらに他の場合、例えば、ネットワークジッタを防止するためにビデオデコーダ(310)の外部にバッファメモリ(示されていない)が存在し、さらに、例えば、再生タイミングを取り扱うためにビデオデコーダ(310)の内部に別のバッファメモリ(315)が存在し得る。受信機(331)が十分な帯域幅および可制御性を有する記憶/転送装置から、または等同期ネットワークからデータを受信する際に、バッファメモリ(315)は必要とされないことがあり、または小さくされることがある。インターネットなどのベストエフォートパケットネットワークで使用するために、バッファメモリ(315)が必要になる場合があり、バッファメモリ(315)、比較的大きいことがあり、有利には適応サイズであることができ、オペレーティングシステムまたはビデオデコーダ(310)の外部の類似の要素(示されていない)に少なくとも部分的に実施され得る。
ビデオデコーダ(310)は、符号化ビデオシーケンスからシンボル(321)を再構築するパーサ(320)を含んでもよい。これらのシンボルのカテゴリは、ビデオデコーダ(310)の操作を管理するために使用される情報、および、電子デバイス(330)の不可欠な部分ではないが、図3に示すように電子デバイス(330)に結合され得るレンダリングデバイス(312)(例えば、表示画面)のようなレンダリングデバイスを制御する潜在的情報を含む。レンダリングデバイスのための制御情報は、補助強化情報(SEIメッセージ)またはビデオユーザビリティ情報(VUI)パラメータセットフラグメント(示されていない)の形態であってよい。パーサ(320)は、受信された符号化ビデオシーケンスを構文解析/エントロピーデコードすることができる。符号化ビデオシーケンスの符号化は、ビデオ符号化技術または規格に合わせることができ、可変長符号化、ハフマン符号化、文脈感受性を有するもしくは有さない算術符号化などを含む様々な原理に従うことができる。パーサ(320)は、サブグループに対応する少なくとも1つのパラメータに基づいて、符号化ビデオシーケンスからビデオデコーダ内の画素の少なくとも1つのサブグループのためのサブグループパラメータのセットを抽出することができる。サブグループは、ピクチャ群(GOP)、ピクチャ、タイル、スライス、マクロブロック、符号化ユニット(CU)、ブロック、変換ユニット(TU)、予測ユニット(PU)などを含むことができる。パーサ(320)は、符号化ビデオシーケンスから変換係数、量子化パラメータ値、動きベクトルなどのような情報をも抽出することができる。
パーサ(320)は、シンボル(321)を作成するために、バッファメモリ(315)から受信されたビデオシーケンスに対してエントロピーデコード/構文解析操作を実行することができる。
シンボル(321)の再構築は、符号化ビデオピクチャまたはその一部(例えば、インターおよびイントラピクチャ、インターおよびイントラブロック)のタイプ、および他の要因に応じて複数の異なるユニットに関与することができる。どのユニットがどのように関与するかは、パーサ(320)によって符号化ビデオシーケンスから構文解析されたサブグループ制御情報によって制御されることができる。パーサ(320)と以下の複数のユニットとの間のそのようなサブグループ制御情報の流れは、明確にするために示されていない。
すでに述べた機能ブロックに加え、ビデオデコーダ(310)は、以下で説明されるようにいくつかの機能ユニットに概念的に細分されることができる。商業的な制約の下で実際の実施操作にあたっては、これらのユニットの多くは互いに密接に相互作用し、少なくとも一部は互いに統合することができる。しかしながら、開示された主題の説明の目的で、以下の機能ユニットへの概念的な細分は、適切に行われる。
第1のユニットは、スケーラ/逆変換ユニット(351)である。スケーラ/逆変換ユニット(351)は、使用する変換、ブロックサイズ、量子化因子、量子化スケーリング行列などを含む制御情報と、量子化された変換係数をシンボル(321)としてパーサ(320)から受信する。スケーラ/逆変換ユニット(351)は、アグリゲータ(355)に入力可能なサンプル値を含むブロックを出力することができる。
場合によっては、スケーラ/逆変換ユニット(351)の出力サンプルは、イントラ符号化ブロック、すなわち、予め再構築されたピクチャからの予測情報を使用していないが、現在ピクチャの予め再構築された部分からの予測情報を使用できるブロックに関係することがある。このような予測情報は、イントラピクチャ予測ユニット(352)によって提供されることができる。場合によっては、イントラピクチャ予測ユニット(352)は、現在ピクチャバッファ(358)から取り出された周囲の既に再構築された情報を用いて、再構築中のブロックの同じサイズおよび形状のブロックを生成する。現在ピクチャバッファ(358)は、例えば、一部再構築された現在ピクチャおよび/または完全に再構築された現在ピクチャをバッファリングする。アグリゲータ(355)は、場合によっては、サンプルごとに、イントラ予測ユニット(352)が生成した予測情報を、スケーラ/逆変換ユニット(351)によって提供される出力サンプル情報に追加する。
他の場合では、スケーラ/逆変換ユニット(351)の出力サンプルは、インター符号化された、潜在的に動き補償されたブロックに関係することがある。このような場合、動き補償予測ユニット(353)は、参照ピクチャメモリ(357)にアクセスして、予測に使用されるサンプルを取り出すことができる。取り出されたサンプルをブロックに関係するシンボル(321)に従って動き補償した後、出力サンプル情報を生成するように、これらのサンプルは、アグリゲータ(355)によってスケーラ/逆変換ユニット(351)の出力に追加されることができる(この場合、残差サンプルまたは残差信号と呼ばれる)。動き補償予測ユニット(353)が予測サンプルを取り出す参照ピクチャメモリ(357)内のアドレスは、例えば、X、Y、および参照ピクチャ成分を有し得るシンボル(321)の形態で動き補償予測ユニット(353)に利用可能な動きベクトルによって制御されることができる。動き補償は、サブサンプル正確な動きベクトルが使用中であるときに参照ピクチャメモリ(357)から取り出されたサンプル値の補間、動きベクトル予測メカニズムなどを含むこともできる。
アグリゲータ(355)の出力サンプルは、ループフィルタユニット(356)において様々なループフィルタリング技法を受けられる。ビデオ圧縮技術は、符号化ビデオシーケンス(符号化されたビデオビットストリームとも呼ばれる)に含まれる、パーサ(320)からのシンボル(321)としてループフィルタユニット(356)に利用可能とされたパラメータによって制御されることができ、それに、符号化ピクチャまたは符号化ビデオシーケンスの(デコード順で)前の部分のデコード中に取得されたメタ情報に応じるとともに、予め再構築されループフィルタリングされたサンプル値に応じることもできるループ内フィルタ技術を含むことができる。
ループフィルタユニット(356)の出力は、レンダリングデバイス(312)へ出力されることができるとともに、将来のインターピクチャ予測で使用するために参照ピクチャメモリ(357)に記憶されることができるサンプルストリームであり得る。
特定の符号化ピクチャは、完全に再構築されると、将来の予測のために参照ピクチャとして使用されることができる。例えば、現在ピクチャに対応する符号化ピクチャが完全に再構築され、該符号化ピクチャが(例えば、パーサ(320)によって)参照ピクチャとして識別されると、現在ピクチャバッファ(358)は、参照ピクチャメモリ(357)の一部になることができ、次の符号化ピクチャの再構築を開始する前に新しい現在ピクチャバッファを再割当てすることができる。
ビデオデコーダ(310)は、ITU-T Rec.H.265のような規格での所定のビデオ圧縮技術に従ってデコード操作を実行することができる。符号化ビデオシーケンスが、ビデオ圧縮技術または規格のシンタックスと、ビデオ圧縮技術または規格で文書化されたプロファイルとの両方に準拠しているという意味で、符号化ビデオシーケンスは、使用されているビデオ圧縮技術または規格によって指定されるシンタックスに準拠し得る。具体的には、プロファイルは、ビデオ圧縮技術または規格で使用可能なすべてのツールから、特定のツールをそのプロファイルで使用できる唯一のツールとして選択することができる。符号化ビデオシーケンスの複雑さがビデオ圧縮技術または規格のレベルで定義される範囲内にあることも、コンプライアンスに必要である。場合によっては、最大ピクチャサイズ、最大フレームレート、最大再構築サンプルレート(例えば、1秒あたりのメガサンプルで測定される)、最大参照ピクチャサイズなどがレベルによって制限される。レベルによって設定された制限は、場合によっては、符号化ビデオシーケンスでシグナリングされたHRDバッファ管理のための仮想参照デコーダ(HRD)仕様およびメタデータによってさらに制限されることができる。
一実施形態では、受信機(331)は、エンコードされたビデオとともに追加の(冗長な)データを受信することができる。追加のデータは、符号化ビデオシーケンスの一部として含まれてもよい。追加のデータは、データを適切にデコードし、および/または、元のビデオデータをより正確に再構築するためにビデオデコーダ(310)によって使用され得る。追加のデータは、例えば、時間的、空間的、または信号対雑音比(SNR)エンハンスメントレイヤ、冗長スライス、冗長ピクチャ、前方向誤り訂正コードなどの形態にされることができる。
図4は、本開示の実施形態によるビデオエンコーダ(403)のブロック図を示す。ビデオエンコーダ(403)は、電子デバイス(420)に含まれる。電子デバイス(420)は、送信機(440)(例えば、送信回路)を含む。ビデオエンコーダ(403)は、図2の例におけるビデオエンコーダ(203)の代わりに使用されることができる。
ビデオエンコーダ(403)は、ビデオエンコーダ(403)によって符号化されるビデオ画像をキャプチャし得るビデオソース(40l)(図4の例では電子デバイス(420)の一部ではない)からビデオサンプルを受信することができる。他の例では、ビデオソース(401)は、電子デバイス(420)の一部である。
ビデオソース(401)は、ビデオエンコーダ(403)によって符号化されるソースビデオシーケンスを、任意の適切なビット深度(例えば、8ビット、10ビット、12ビット、・・・)、任意の色空間(例えば、BT.601 Y CrCB、RGB、・・・)および任意の適切なサンプリング構造(例えば、Y CrCb 4:2:0、Y CrCb 4:4:4)であり得るデジタルビデオサンプルストリームの形態で提供し得る。メディア供給システムでは、ビデオソース(401)は、予め準備されたビデオを記憶する記憶装置であり得る。ビデオ会議システムでは、ビデオソース(401)は、ローカル画像情報をビデオシーケンスとしてキャプチャするカメラであり得る。ビデオデータは、順番に見られるときに動きが与えられる複数の個別のピクチャとして提供されてもよい。ピクチャ自体は、画素の空間アレイとして編成されてもよく、各画素は、使用中のサンプリング構造、色空間などに応じて1つ以上のサンプルを含むことができる。当業者は、画素とサンプルとの関係を容易に理解することができる。以下の説明ではサンプルを中心に説明する。
一実施形態によれば、ビデオエンコーダ(403)は、リアルタイムでまたはアプリケーションが要求する任意の他の時間制約の下でソースビデオシーケンスのピクチャを符号化し、符号化ビデオシーケンス(443)に圧縮することができる。適切な符号化速度を実施することは、コントローラ(450)の機能の1つである。一部の実施形態では、コントローラ(450)は、以下で説明する他の機能ユニットを制御し、他の機能ユニットに機能的に結合される。分かりやすくするために、カップリングは示されていない。コントローラ(450)によって設定されるパラメータは、レート制御関連パラメータ(ピクチャスキップ、量子化、レート歪み最適化技法のラムダ値、・・・)、ピクチャサイズ、ピクチャ群(GOP)レイアウト、最大動きベクトル検索範囲などを含むことができる。コントローラ(450)は、特定のシステム設計に対して最適化されたビデオエンコーダ(403)に関する他の適切な機能を有するように構成されることができる。
一部の実施形態では、ビデオエンコーダ(403)は、符号化ループで動作するように構成される。過度に簡略化した説明として、一例では、符号化ループは、ソースコーダ(430)(例えば、符号化対象となる入力ピクチャおよび参照ピクチャに基づくシンボルストリームなどのシンボルの作成を担当する)、およびビデオエンコーダ(403)に埋め込まれた(ローカル)デコーダ(433)を含むことができる。デコーダ(433)は、シンボルを再構築して、(リモート)デコーダが作成するのと同様な方式でサンプルデータを作成する(シンボルと符号化されたビデオビットストリーム間の如何なる圧縮は、開示された主題で考慮されるビデオ圧縮技術では可逆であるためである)。再構築されたサンプルストリーム(サンプルデータ)は、参照ピクチャメモリ(434)に入力される。シンボルストリームのデコードにより、デコーダの位置(ローカルまたはリモート)に関係なくビット正確な結果が得られるため、参照ピクチャメモリ(434)のコンテンツもローカルエンコーダとリモートエンコーダの間でビット正確である。言い換えれば、エンコーダの予測部分は、参照ピクチャサンプルとして、デコード中に予測を使用するときにデコーダが「見る」のと全く同じサンプル値を「見る」。参照ピクチャの同期性(および例えばチャネルエラーに起因して同期性を維持できない場合に生じるドリフト)の該基本原理は、いくつかの関連分野にも使用されている。
「ローカル」デコーダ(433)の動作は、前文で図3に関連して既に詳細に説明された、ビデオデコーダ(310)などの「リモート」デコーダの動作と同様であり得る。しかしながら、図3も簡単に参照し、シンボルが使用可能であり、エントロピーコーダ(445)およびパーサ(320)による符号化ビデオシーケンスへのシンボルのエンコード/デコードは可逆であり得るので、バッファメモリ(315)、およびパーサ(320)を含むビデオデコーダ(310)のエントロピーデコード部分は、ローカルデコーダ(433)では完全に実施されない場合がある。
これで分かるように、デコーダに存在する構文解析/エントロピーデコード以外の如何なるデコーダ技術も、対応するエンコーダに実質的に同一の機能的形態で必ず存在する必要がある。このため、開示された主題は、デコーダ操作に焦点を合わせている。エンコーダ技術の説明は、包括的に説明されたデコーダ技術の逆であるため、省略できる。特定の領域でのみ、より詳細な説明が必要であり、以下に提供される。
操作中、一部の例では、ソースコーダ(430)は、「参照ピクチャ」として指定されたビデオシーケンスからの1つ以上の予め符号化されたピクチャを参照して入力ピクチャを予測的に符号化する動き補償予測符号化を実行してもよい。このようにして、符号化エンジン(432)は、入力ピクチャの画素ブロックと、入力ピクチャへの予測基準として選択され得る参照ピクチャの画素ブロックとの差異を符号化する。
ローカルビデオデコーダ(433)は、ソースコーダ(430)で作成されたシンボルに基づいて、参照ピクチャとして指定され得るピクチャの符号化ビデオデータをデコードすることができる。符号化エンジン(432)の操作は、有利にはロッシープロセスであり得る。符号化ビデオデータがビデオデコーダ(図4に示されていない)でデコードされ得るとき、再構築されたビデオシーケンスは、通常、いくつかのエラーを伴うソースビデオシーケンスのレプリカであってもよい。ローカルビデオデコーダ(433)は、ビデオデコーダによって参照ピクチャに対して実行され得るデコードプロセスを再現し、再構築された参照ピクチャを参照ピクチャキャッシュ(434)に記憶させることができる。このようにして、ビデオエンコーダ(403)は、遠端ビデオデコーダによって取得される再構築された参照ピクチャと共通するコンテンツ(送信エラー無し)を有する再構築された参照ピクチャのコピーをローカルに記憶し得る。
予測器(435)は、符号化エンジン(432)の予測検索を実行することができる。つまり、符号化対象となる新しいピクチャについて、予測器(435)は、(候補の参照画素ブロックとしての)サンプルデータ、または、参照ピクチャの動きベクトル、ブロック形状など、新しいピクチャの適切な予測基準として機能し得る特定のメタデータを参照ピクチャメモリ(434)で検索することができる。予測器(435)は、適切な予測基準を見つけるために、サンプルブロック/画素ブロックごとに操作することができる。場合によっては、予測器(435)で取得された検索結果によって決定されるように、入力ピクチャは、参照ピクチャメモリ(434)に記憶された複数の参照ピクチャから引き出された予測基準を有してもよい。
コントローラ(450)は、例えば、ビデオデータをエンコードするために使用されるパラメータおよびサブグループパラメータの設定を含む、ソースコーダ(430)の符号化操作を管理することができる。
前述のすべての機能ユニットの出力は、エントロピーコーダ(445)においてエントロピー符号化を受けられる。エントロピーコーダ(445)は、例えば、ハフマン符号化、可変長符号化、算術符号化など、当業者に知られている技術に従ってシンボルを可逆圧縮することにより、様々な機能ユニットによって生成されたシンボルを符号化ビデオシーケンスに変換する。
送信機(440)は、エンコードされたビデオデータを記憶する記憶装置へのハードウェア/ソフトウェアリンクであり得る通信チャネル(460)を介した送信の準備のために、エントロピーコーダ(445)によって作成された符号化ビデオシーケンスをバッファリングすることができる。送信機(440)は、ビデオコーダ(403)からの符号化ビデオデータを、送信されるべき他のデータ、例えば、符号化オーディオデータおよび/または補助データストリーム(ソースは示されていない)とマージすることができる。
コントローラ(450)は、ビデオエンコーダ(403)の操作を管理し得る。符号化中、コントローラ(450)は、各符号化ピクチャに特定の符号化ピクチャタイプを割り当てることができ、これは、それぞれのピクチャに適用され得る符号化技法に影響を及ぼし得る。例えば、ピクチャは、多くの場合、次のピクチャタイプのいずれかとして割り当てられ得る。
イントラピクチャ(Iピクチャ)は、予測のソースとしてシーケンス内の他のいかなるピクチャを使用せずに符号化および復号され得るものであり得る。一部のビデオコーデックは、例えば、インディペンデントデコーダリフレッシュ(Independent Decoder Refresh、「IDR」)ピクチャを含む、異なるタイプのイントラピクチャを許容する。当業者は、Iピクチャのそれらの変形およびそれらのそれぞれの用途および特徴を知っている。
予測ピクチャ(Pピクチャ)は、各ブロックのサンプル値を予測するために最大1つの動きベクトルおよび参照インデックスを使用したイントラ予測またはインター予測により符号化および復号され得るものであり得る。
双方向予測ピクチャ(Bピクチャ)は、各ブロックのサンプル値を予測するために最大2つの動きベクトルおよび参照インデックスを使用したイントラ予測またはインター予測により符号化および復号され得るものであり得る。同様に、多重予測ピクチャは、単数のブロックの再構築のために2つを超えた参照ピクチャおよび関連メタデータを使用することができる。
ソースピクチャは、一般に、複数のサンプルブロック(例えば、それぞれ、4×4、8×8、4×8、または16×16サンプルのブロック)に空間的に細分され、ブロック単位で符号化され得る。ブロックは、ブロックのそれぞれのピクチャに適用される符号化割り当てによって決定された他の(既に符号化された)ブロックを参照して予測的に符号化され得る。例えば、Iピクチャのブロックは、非予測的に符号化されてもよく、或いは、同一のピクチャの既に符号化されたブロック(空間予測またはイントラ予測)を参照して予測的に符号化されてもよい。Pピクチャの画素ブロックは、1つの予め符号化された参照ピクチャを参照して、空間予測を介してまたは時間予測を介して予測的に符号化され得る。Bピクチャのブロックは、1つまたは2つの予め符号化された参照ピクチャを参照して、空間予測を介してまたは時間予測を介して予測的に符号化され得る。
ビデオエンコーダ(403)は、ITU-T Rec.H.265などの予め設定されたビデオ符号化技術または規格に従って、符号化操作を実行することができる。この操作において、ビデオエンコーダ(403)は、入力ビデオシーケンスの時間的および空間的冗長性を利用する予測符号化操作を含む、様々な圧縮操作を実行することができる。したがって、符号化ビデオデータは、使用されるビデオ符号化技術または規格によって指定されたシンタックスに準拠する場合がある。
一実施形態では、送信機(440)は、エンコードされたビデオとともに追加のデータを送信することができる。ソースコーダ(430)は、このようなデータを符号化ビデオシーケンスの一部として含み得る。追加のデータは、時間的/空間的/SNRエンハンスメントレイヤ、冗長なピクチャやスライスなどの他の形態での冗長データ、補助強化情報(SEI)メッセージ、ビジュアルユーザビリティ情報(VUI)パラメータセットフラグメントなどを含み得る。
ビデオは、時系列で複数のソースピクチャ(ビデオピクチャ)としてキャプチャされ得る。イントラピクチャ予測(「イントラ予測」と略されることが多い)は、所定のピクチャにおける空間相関を利用し、インターピクチャ予測は、ピクチャ間の(時間的または他の)相関を利用する。一例では、現在ピクチャと呼ばれるエンコード/デコード中の特定のピクチャは、ブロックに分割される。現在ピクチャにおけるブロックが、ビデオにおける予め符号化され、まだバッファリングされている参照ピクチャ内の参照ブロックに類似している場合、現在ピクチャにおけるブロックは、動きベクトルと呼ばれるベクトルによって符号化されることができる。動きベクトルは、参照ピクチャ内の参照ブロックを指し、複数の参照ピクチャが使用されている場合、参照ピクチャを識別する第3次元を有することができる。
一部の実施形態では、インターピクチャ予測において双予測法を使用することができる。双予測法によれば、ビデオにおける現在ピクチャよりもデコード順序がそれぞれ前である(ただし、表示順序でそれぞれ過去および未来にあり得る)第1および第2の参照ピクチャのような2つの参照ピクチャを使用する。現在ピクチャ内のブロックは、第1の参照ピクチャ内の第1の参照ブロックを指す第1の動きベクトル、および第2の参照ピクチャ内の第2の参照ブロックを指す第2の動きベクトルによって符号化されることができる。ブロックは、第1の参照ブロックと第2の参照ブロックとの組み合わせによって予測されることができる。
さらに、マージモード技法をインターピクチャ予測に使用して、符号化効率を向上させることができる。マージモードでは、現在ピクチャ内のブロックは、現在ピクチャ内の隣接ブロック(例えば、ブロックと境界を共有し、ブロックとのより大きな区分領域に配置されるブロック)の動きベクトルを継承することができる。
本開示の一部の実施形態によれば、インターピクチャ予測およびイントラピクチャ予測などの予測は、ブロック単位で実行される。例えば、HEVC規格によれば、一連のビデオピクチャ内のピクチャは、圧縮のために符号化ツリーユニット(CTU)に分割され、ピクチャ内のCTUは、64×64画素、32×32画素、または16×16画素など、同一のサイズを有する。一般に、CTUは、1つの輝度(luma)CTBと2つの彩度CTBである3つの符号化ツリーブロック(CTB)を含む。各CTUは、1つまたは複数の符号化ユニット(CU)に再帰的に四分木分割されることができる。例えば、64×64画素のCTUは、1つの64×64画素のCU、4つの32×32画素のCU、または16つの16×16画素のCUに分割されることができる。一例では、各CUを解析して、インター予測タイプまたはイントラ予測タイプなど、CUの予測タイプを決定する。CUは、時間的および/または空間的予測可能性に応じて、1つ以上の予測ユニット(PU)に分割される。通常、各PUは、1つの輝度予測ブロック(PB)と2つの彩度PBを含む。一実施形態では、符号化(エンコード/デコード)における予測操作は、予測ブロックの単位で実行される。輝度予測ブロックを予測ブロックの例として用いて、予測ブロックは、8×8画素、16×16画素、8×16画素、16×8画素などの画素の値(例えば、輝度値)の行列を含む。
図5は、本開示の他の実施形態によるビデオエンコーダ(503)の図を示す。ビデオエンコーダ(503)は、一連のビデオピクチャ内の現在ビデオピクチャにおけるサンプル値の処理ブロック(例えば、予測ブロック)を受信し、該処理ブロックを、符号化ビデオシーケンスの一部である符号化ピクチャにエンコードするように構成される。一例では、図2の例におけるビデオエンコーダ(203)の代わりにビデオエンコーダ(503)を使用する。
HEVCの例では、ビデオエンコーダ(503)は、8×8サンプルのような予測ブロックなどの処理ブロックのサンプル値の行列を受信する。ビデオエンコーダ(503)は、例えばレート歪み最適化を用いて、処理ブロックをイントラモード、インターモード、または双予測モードにより最も良く符号化するか否かを判定する。処理ブロックがイントラモードで符号化されようとする場合、ビデオエンコーダ(503)は、イントラ予測法を用いて処理ブロックを符号化ピクチャにエンコードすることができる。また、処理ブロックがインターモードまたは双予測モードで符号化されようとする場合、ビデオエンコーダ(503)は、それぞれインター予測または双予測法を用いて、処理ブロックを符号化ピクチャにエンコードすることができる。特定のビデオ符号化技術では、マージモードは、予測器外の符号化動きベクトル成分の利便を介することなく、1つ以上の動きベクトル予測器から動きベクトルを導出するインターピクチャ予測サブモードであり得る。特定の他のビデオ符号化技術では、対象ブロックに適用可能な動きベクトル成分が存在し得る。一例では、ビデオエンコーダ(503)は、処理ブロックのモードを決定するためのモード決定モジュール(図示せず)などの他の構成要素を含む。
図5の例では、ビデオエンコーダ(503)は、図5に示すように互いに結合されたインターエンコーダ(530)、イントラエンコーダ(522)、残差算出部(523)、スイッチ(526)、残差エンコーダ(524)、統括制御部(521)およびエントロピーエンコーダ(525)を含む。
インターエンコーダ(530)は、現在ブロック(例えば、処理ブロック)のサンプルを受信し、該ブロックを参照ピクチャ内の1つ以上の参照ブロック(例えば、前のピクチャおよび後のピクチャ内のブロック)と比較し、インター予測情報(例えば、インターエンコード法による冗長情報の記述、動きベクトル、マージモード情報)を生成し、インター予測情報に基づいて任意の適切な技法を用いてインター予測結果(例えば、予測ブロック)を算出するように構成される。一部の例では、参照ピクチャは、エンコードされたビデオ情報に基づいてデコードされたデコード参照ピクチャである。
イントラエンコーダ(522)は、現在ブロック(例えば、処理ブロック)のサンプルを受信し、場合によっては該ブロックを同一ピクチャで既に符号化されたブロックと比較し、変換後に量子化された係数を生成し、場合によってはイントラ予測情報(例えば、1つ以上のイントラエンコード法によるイントラ予測方向情報)をも生成するように構成される。一例では、イントラエンコーダ(522)は、イントラ予測情報および同一ピクチャ内の参照ブロックに基づいてイントラ予測結果(例えば、予測ブロック)をも算出する。
統括制御部(521)は、統括制御データを決定し、統括制御データに基づいてビデオエンコーダ(503)の他の構成要素を制御するように構成される。一例では、統括制御部(521)は、ブロックのモードを決定し、モードに基づいて制御信号をスイッチ(526)に提供する。例えば、モードがイントラである場合、統括制御部(521)は、残差算出部(523)が使用するためのイントラモード結果を選択するようにスイッチ(526)を制御するとともに、イントラ予測情報を選択してイントラ予測情報をビットストリームに含ませるようにエントロピーエンコーダ(525)を制御する。また、モードがインターモードである場合、統括制御部(521)は、残差算出部(523)が使用するためのインター予測結果を選択するようにスイッチ(526)を制御するとともに、インター予測情報を選択してインター予測情報をビットストリームに含ませるようにエントロピーエンコーダ(525)を制御する。様々な実施形態では、ビデオエンコーダ(503)は、残差デコーダ(528)をも含む。残差デコーダ(528)は、逆変換を実行し、デコード残差データを生成するように構成される。デコード残差データは、イントラエンコーダ(522)およびインターエンコーダ(530)によって適切に使用されることができる。例えば、インターエンコーダ(530)は、デコード残差データよびインター予測情報に基づいて、デコードブロックを生成することができ、イントラエンコーダ(522)は、デコード残差データおよびイントラ予測情報に基づいて、デコードブロックを生成することができる。一部の例では、デコードブロックは、デコードピクチャを生成するように適切に処理され、デコードピクチャは、メモリ回路(図示せず)にバッファリングされ、参照ピクチャとして使用されることができる。
残差算出部(523)は、受信されたブロックとイントラエンコーダ(522)またはインターエンコーダ(530)から選択された予測結果との差(残差データ)を算出するように構成される。残差エンコーダ(524)は、残差データに基づいて動作し、残差データをエンコードして変換係数を生成するように構成される。一例では、残差エンコーダ(524)は、周波数領域で残差データを転換し、変換係数を生成するように構成される。その後、変換係数は量子化処理を受けて、量子化された変換係数が得られる。
エントロピーエンコーダ(525)は、ビットストリームをフォーマットしてエンコードブロックを生成するように構成される。エントロピーエンコーダ(525)は、HEVC規格などの適切な規格に従う様々な情報をビットストリームに含ませるように構成される。一例では、エントロピーエンコーダ(525)は、統括制御データ、選択された予測情報(例えば、イントラ予測情報またはインター予測情報)、残差情報、および他の適切な情報をビットストリームに含ませるように構成される。開示された主題によれば、インターモードまたは双予測モードのマージサブモードでブロックを符号化する場合、残差情報はないことに留意されたい。
図6は、本開示の他の実施形態によるビデオデコーダ(610)の図を示す。ビデオデコーダ(610)は、符号化ビデオシーケンスの一部である符号化ピクチャを受信し、符号化ピクチャをデコードして再構築ピクチャを生成するように構成される。一例では、図2の例におけるビデオデコーダ(210)の代わりにビデオデコーダ(610)を使用する。
図6の例では、ビデオデコーダ(610)は、図6に示されるように互いに結合されたエントロピーデコーダ(671)、インターデコーダ(680)、残差デコーダ(673)、再構築モジュール(674)、およびイントラデコーダ(672)を含む。
エントロピーデコーダ(671)は、符号化ピクチャから、符号化ピクチャを構成するシンタックス要素を表す特定のシンボルを再構築するように構成されることができる。このようなシンボルは、例えば、ブロックが符号化されるモード(例えば、イントラ、マージサブモードまたは他のサブモードにおけるインターと双予測)、それぞれイントラデコーダ(672)またはインターデコーダ(680)による予測に使用される特定のサンプルまたはメタデータを識別できる予測情報(例えば、イントラ予測情報またはインター予測情報)、例えば、量子化された変換係数の形態での残差情報などを含むことができる。一例では、予測モードがインターまたは双予測モードであれば、インター予測情報は、インターデコーダ(680)に提供される。また、予測タイプがイントラ予測タイプであれば、イントラ予測情報は、イントラデコーダ(672)に提供される。残差情報は、逆量子化を施されることができ、残差デコーダ(673)に提供される。
インターデコーダ(680)は、インター予測情報を受信し、インター予測情報に基づいてインター予測結果を生成するように構成される。
イントラデコーダ(672)は、イントラ予測情報を受信し、イントラ予測情報に基づいてイントラ予測結果を生成するように構成される。
残差デコーダ(673)は、逆量子化を実行して、逆量子化された変換係数を抽出し、逆量子化された変換係数を処理して残差を周波数領域から空間領域に転換するように構成される。残差デコーダ(673)は、(量子化器パラメータQPを含めるように)特定の制御情報をも必要とする場合があり、この情報は、エントロピーデコーダ(671)によって提供されてもよい(データパスは、低ボリューム制御情報のみであり得るため、示されていない)。
再構築モジュール(674)は、空間領域において、残差デコーダ(673)によって出力された残差と、(場合によってはインターまたはイントラ予測モジュールによって出力される)予測結果とを組み合わせて、再構築ビデオの一部となり得る再構築ピクチャの一部であり得る再構築ブロックを形成するように構成される。なお、視覚的品質を改善するために、デブロッキング操作などの他の適切な操作を実行することができる。
なお、ビデオエンコーダ(203)、(403)および(503)とビデオデコーダ(210)、(310)および(610)は、任意の適切な技法を用いて実施されることができる。一実施形態では、ビデオエンコーダ(203)、(403)および(503)とビデオデコーダ(210)、(310)および(610)は、1つ以上の集積回路を用いて実施されることができる。他の実施形態では、ビデオエンコーダ(203)、(403)および(503)とビデオデコーダ(210)、(310)および(610)は、ソフトウェア命令を実行する1つ以上のプロセッサを用いて実施されることができる。
図7は、イントラ予測に使用される例示的な角度モードの実施形態を示している。図7では、右下に示されたのは、H.265の35通りの予測可能な方向からのものであり得る9通りの予測方向の例である。矢印が収束する点(701)は、予測されているサンプルを表す。矢印は、サンプルが予測されている方向を表す。例えば、矢印(702)は、サンプル(701)が、1つまたは複数のサンプルから右上に、水平軸から45度の角度で予測されることを示す。同様に、矢印(703)は、サンプル(701)が、1つまたは複数のサンプルからサンプル(701)の左下に、水平軸から22.5度の角度で予測されることを示す。
引き続き図7を参照し、左上には、4×4サンプルの正方形ブロック(704)(太い破線で示される)が示されている。正方形ブロック(704)は、それぞれが、「S」、Y次元におけるその位置(例えば、行インデックス)、およびX次元におけるその位置(例えば、列インデックス)でラベル付けされた16サンプルを含む。例えば、サンプルS21は、Y次元(上から)における2番目のサンプルかつX次元(左から)における1番目のサンプルである。同様に、サンプルS44は、YおよびX次元の両方においてブロック(704)における4番目のサンプルである。ブロックがサイズで4×4サンプルなので、S44は、右下にある。さらに、同様な番号付け体系に従う参照サンプルが示されている。参照サンプルは、R、ブロック(704)に対するそのY位置(例えば、行インデックス)およびX位置(列インデックス)でラベル付けされる。イントラピクチャ予測は、シグナリングされた予測方向で適正化されたように隣接サンプルから参照サンプル値をコピーすることで機能することができる。例えば、仮に、符号化されたビデオビットストリームは、このブロックについて矢印(702)(すなわち、サンプルが、1つまたは複数の予測サンプルから右上に、水平から45度の角度で予測される)と一致する予測方向を示すシグナリングを含むとする。この場合、サンプルS41、S32、S23、およびS14は参照サンプルR05から予測される。そして、サンプルS44は、参照サンプルR08から予測される。
特定の場合において、複数の参照サンプルの値は、一つの参照サンプルを算出するために、特に方向が45度で均等に分割されていない場合に、例えば補間によって組み合わせられることができる。
図8Aおよび8Bは、33通りの角度モードを含む合計35通りのイントラ予測モードの実施形態を示している。モード0はINTRA_PLANARモードで、モード1はINTRA_DCモードである。さらに、モード2~34は角度内モードINTRA_ANGULAR2~INTRA_ANGULAR34を表す。モード10は水平角度モードで、モード26は垂直モードである。
図9Aおよび9Bは、65通りの角度モードを含む合計67通りのイントラ予測モードの実施形態を示している。モード0はINTRA_PLANARモードで、モード1はINTRA_DCモードである。さらに、モード2~66は、それぞれ、角度内モードINTRA_ANGULAR2~INTRA_ANGULAR66を表す。モード18は水平モードで、モード50は垂直モードである。
PUは、輝度成分と彩度成分の両方を含み得る。一部の実施形態によれば、彩度成分の予測モードを決定するとき、エンコーダまたはデコーダは、平面モード(即ち、INTRA_PLANAR)、DCモード(即ち、INTRA_DC)、水平モード、垂直モード、および/または、輝度成分のイントラ予測モードのダイレクトコピー(DMモード)のうちの1つから彩度予測モードを選択する。
一部の実施形態によれば、クロスコンポーネント線形モデル(CCLM)予測モードは、クロスコンポーネント冗長性を低減するために使用されることができ、彩度サンプルは、次のような線形モデルを用いることで、同じCUの再構築輝度サンプルに基づいて予測される。
式1
Figure 0007046220000001
ただし、pred(i,j)は、CUにおける予測彩度サンプルを表し、rec’(i,j)は、同じCUのダウンサンプリングされた再構築輝度サンプルを表す。
パラメータαおよびβは、以下のように、現在のブロックの周りの隣接する再構築輝度および彩度サンプル間の回帰誤差を最小化することによって導出され得る。
式2

Figure 0007046220000002
式3

Figure 0007046220000003
ただし、L(n)は、ダウンサンプリングされた上部および左の隣接する再構築輝度サンプルを表し、C(n)は、上部および左の隣接する再構築彩度サンプルを表し、Nの値は現在の彩度符号化ブロックの幅と高さの最小値の2倍に等しい。
正方形の形状を有する符号化ブロックについて、上記2つの方程式を直接適用することができる。非正方形の符号化ブロックについて、より長い境界の隣接サンプルは、より短い境界の場合と同じ数のサンプルを持つようにサブサンプリングされる。図10Aおよび10Bは、αおよびβの導出に使用されるサンプルの位置の例を示す。
一部の実施形態によれば、CCLM予測モードは、2つの彩度成分間の予測(即ち、Cr成分はCb成分から予測される)を含む。例えば、再構築されたサンプル信号を使用する代わりに、CCLM Cb対Cr予測は、残差領域で適用される。この予測は、次のように、重み付けされた再構築Cb残差を元のCrイントラ予測に追加して、最終的なCr予測を形成することによって実施され得る。
式4
Figure 0007046220000004
スケーリング因子αは、CCLM輝度-彩度予測と同様の方法で導出することができ、ここで、差は、デフォルトでのαの値に対する回帰コストをエラー関数に追加することであり、その結果、導出されたスケーリング因子は、次のようにデフォルト値-0.5にバイアスされる。
式5

Figure 0007046220000005
ただし、Cb(n)は、隣接する再構築Cbサンプルを表し、Cr(n)は、隣接する再構築Crサンプルを表し、

Figure 0007046220000006
である。
一部の実施形態によれば、CCLM輝度-彩度予測モードを1つの追加の彩度イントラ予測モードとして追加してもよい。エンコーダ側では、彩度イントラ予測モードを選択することを目的として、彩度成分のもう1つのレート歪み(RD)コストチェックを追加することができる。CCLM輝度-彩度予測モード以外のイントラ予測モードをCUの彩度成分に使用する場合、CCLM Cb対Cr予測は、Cr成分予測に使用され得る。
一部の実施形態によれば、輝度および彩度ブロックが同一の区分構造を共有し得るため、最小輝度ブロック区分は、4×4であり、最小彩度ブロック区分は、YUV 4:2:2および4:2:0フォーマットについてそれぞれ2×4および2×2になる。その結果、イントラ予測モードは、2×2、2×NおよびN×2彩度ブロックに対してシグナリングされる必要があり、これは高価となる可能性があり、符号化効率の向上は、イントラモード符号化の追加コストを正当化しないことがある。本実施形態は、小ブロックに使用されるイントラ予測モードの数を減らすことにより、小ブロックをイントラ符号化するコストを削減するという非常に有利な特徴を提供する。
一部の実施形態によれば、ブロックのサイズがブロックサイズ閾値以下である場合、ブロックは、小ブロックとして識別される。一例として、ブロックサイズ閾値はN×Yブロックであり得、NおよびYは、正の整数である。例えば、NおよびYが4に等しい場合、小ブロックの例は、2×2ブロック、2×4ブロック、および/または4×2ブロックを含む。
小ブロックの別の例は、2×NおよびN×2ブロックを含み、Nは、正の整数である。小ブロックの別の例は、3×NおよびN×3彩度ブロックを含み、Nは、正の整数である。小ブロックの別の例は、4×NおよびN×4彩度ブロックを含み、Nは、正の整数である。
一部の実施形態では、ブロックサイズ閾値は、最小輝度イントラ符号化ブロックユニットサイズ(smallest luma intra coded block unit size)のブロック面積、ブロック幅、およびブロック高さの1つである。一部の実施形態では、ブロックサイズ閾値は、所定の値(例えば、16または32)であり得る画素の数に従って設定されるか、或いは、シーケンスパラメータセット(SPS)、ピクチャパラメータセット(PPS)、またはスライスヘッダーなどのビットストリームでシグナリングされる。
一部の実施形態によれば、小さな彩度イントラ符号化ブロック(例えば、2×4および4×2ブロック)について、他のブロックサイズに適用されるイントラ予測モードのすべてではなく、イントラ予測モードのサブセットのみが使用される。イントラ予測モードのサブセットは、他のブロックサイズに適用されるイントラ予測モードの1つ以上(すべてではない)であってもよい。一実施形態では、小さな彩度イントラ符号化ブロックに適用されるイントラ予測モードは、DMモードのみであってもよい。他の実施形態では、小さな彩度イントラ符号化ブロックに適用されるイントラ予測モードは、CCLMモードのみであってもよい。
一部の実施形態によれば、小さな彩度イントラ符号化ブロックに適用されるイントラ予測モードは、DMモード、CCLMモード、および他のイントラ予測モードXのうちの1つであってもよい。イントラ予測モードXは、平面モード、DCモード、水平モード、および垂直モードのうちの1つであり得る。
一部の実施形態によれば、イントラ予測モードの縮小セットが使用される。例えば、イントラ予測モードの縮小セットは、DMおよびCCLMモードのみを含んでもよく、彩度イントラモードインデックスは、どのモードが使用されるかを示すように1ビットによって二値化される。例えば、彩度イントラモードインデックスが0に設定された場合、DMモードが使用され、彩度イントラモードインデックスが1に設定された場合、CCLMモードが使用される。
小さな彩度符号化ブロックの場合、変換係数シグナリングが低減される。一実施形態では、ブロックサイズ閾値以下のブロックサイズを有する彩度ブロックについて、1つのDC係数のみがシグナリングされる。他の実施形態では、ブロックサイズ閾値以下のブロックサイズを有する彩度ブロックについて、変換係数がシグナリングされず、符号化ブロックフラグ(CBF)はゼロとして推論され得る。CBFは、ブロック内の非ゼロ係数の存在を示すために使用され得る。例えば、1に設定されたCBFは、小さな彩度符号化ブロックに非ゼロ係数が含まれることを示し、0に設定されたCBFは、小さな彩度符号化ブロックに非ゼロ係数が含まれないことを示す。
図11は、それぞれイントラエンコーダ522またはイントラデコーダ672などのエンコーダまたはデコーダによって実行され得る処理の実施形態を示している。該処理は、彩度ブロックのブロックサイズを判定するステップS1100で開始することができる。該処理は、彩度ブロックの判定されたブロックサイズがブロックサイズ閾値以下であるか否かを判定するステップS1102に進む。彩度ブロックの判定されたブロックサイズがブロックサイズ閾値以下であれば、彩度ブロックは、小ブロックであると判定される。例えば、彩度ブロックの高さ、幅、または面積がブロックサイズ閾値以下であれば、彩度ブロックは、小ブロックであると判定される。
判定されたブロックサイズがブロックサイズ閾値よりも大きければ、処理は、ステップS1102から、彩度ブロック用のイントラ予測モードを複数のイントラ予測モードから選択するステップS1104へ進む。しかしながら、判定されたブロックサイズがブロックサイズ閾値以下であれば(即ち、彩度ブロックが小ブロックである)、処理は、ステップS1102から、彩度ブロック用のイントラ予測モードを複数のイントラ予測モードのサブセットから選択するステップS1106へ進む。上述したように、サブセットは、複数のイントラ予測モードの1つ以上(全部ではない)を含む。
処理は、S1104からおよびS1106から、選択されたイントラ予測モードを用いて取得された彩度サンプルに基づいて、彩度ブロックのイントラ予測を実行するS1108へ進む。図11に示される処理をステップS1108の後に終了する。
以上で説明された技法は、コンピュータ読取可能な命令を使用するコンピュータソフトウェアとして実施され、1つ以上のコンピュータ読取可能な媒体に物理的に記憶されることができる。例えば、図12は、開示された主題の特定の実施形態を実施することに適したコンピュータシステム(1200)を示す。
コンピュータソフトウェアは、アセンブリ、コンパイル、リンク、またはそのようなメカニズムを施されて、1つ以上のコンピュータ中央処理装置(CPU)、グラフィックスプロセッシングユニット(GPU)などによって直接、または解釈、マイクロコード実行などによって実行されることができる命令を含むコードを作成する任意の適切な機械コードまたはコンピュータ言語を用いて符号化されることができる。
命令は、例えば、パーソナルコンピュータ、タブレットコンピュータ、サーバ、スマートフォン、ゲームデバイス、モノのインターネットデバイスなどを含む、様々なタイプのコンピュータまたはそのコンポーネント上で実行されることができる。
コンピュータシステム(1200)について、図12に示される例示的なコンポーネントは、本質的に例示的なものであり、本開示の実施形態を実施するコンピュータソフトウェアの使用または機能の範囲に関していかなる限定を示唆することも意図しない。コンポーネントの構成は、コンピュータシステム(1200)の例示的な実施形態で示されるコンポーネントのうちのいずれか1つ又は組み合わせに関する任意の依存性又は必要性を有するとして解釈されるべきではない。
コンピュータシステム(1200)は、特定のヒューマンインターフェース入力デバイスを含み得る。このようなヒューマンインターフェース入力デバイスは、例えば、触覚入力(キーストローク、スワイプ、データグローブの動きなど)、オーディオ入力(音声、拍手など)、視覚入力(ジェスチャーなど)、嗅覚入力(示されていない)によって、1人以上のユーザによる入力に応答することができる。ヒューマンインターフェースデバイスは、オーディオ(音声、音楽、環境音など)、画像(走査画像、静止画像カメラから取得される写真画像など)、ビデオ(2次元ビデオ、立体ビデオを含む3次元ビデオなど)など、人間による意識的な入力に必ずしも直接関係しない特定のメディアをキャプチャすることにも使用できる。
入力ヒューマンインターフェースデバイスは、キーボード(1201)、マウス(1202)、トラックパッド(1203)、タッチスクリーン(1210)、データグローブ(図示せず)、ジョイスティック(1205)、マイクフォン(1206)、スキャナ(1207)、カメラ(1208)(それぞれ1つのみ示されている)のうちの1つ以上を含み得る。
コンピュータシステム(1200)は、特定のヒューマンインターフェース出力デバイスをも含み得る。このようなヒューマンインターフェース出力デバイスは、例えば、触覚出力、音声、光、および嗅覚/味覚を介して1人以上のユーザの感覚を刺激し得る。このようなヒューマンインターフェース出力デバイスは、触覚出力デバイス(例えば、タッチスクリーン(1210)、データグローブ(図示せず)、またはジョイスティック(1205)による触覚フィードバックがあるが、入力デバイスとして機能しない触覚フィードバックデバイスであってもよい)、オーディオ出力デバイス(スピーカ(1209)、ヘッドホン(示されていない)など)、視覚出力デバイス(CRTスクリーン、LCDスクリーン、プラズマスクリーン、OLEDスクリーンを含むスクリーン(1210)(それぞれタッチスクリーン入力能力を有するかもしくは有せず、それぞれ触覚フィードバック能力を有するかもしくは有しない。それらの一部は、ステレオグラフィック出力などの手段を介して、2次元の視覚出力または3次元以上の出力を出力することができる)、仮想現実眼鏡(示されていない)、ホログラフィックディスプレおよびスモークタンク(示されていない)など)、およびプリンタ(示されていない)を含み得る。
コンピュータシステム(1200)は、人間がアクセス可能な記憶装置およびそれらの関連する媒体、例えば、CD/DVDなどの媒体(1221)付きのCD/DVD ROM/RW(1220)を含む光学媒体、サムドライブ(1222)、リムーバブルハードドライブまたはソリッドステートドライブ(1223)、テープやフロッピーディスクなどの従来の磁気媒体(示されていない)、セキュリティドングルなどの専用のROM/ASIC/PLDベースのデバイス(示されていない)などをも含むことができる。
ここで開示された主題に関連して使用される「コンピュータ読取可能な媒体」という用語は、送信媒体、搬送波、または他の一時的な信号を包含しないことをも当業者が理解するべきである。
コンピュータシステム(1200)は、1つ以上の通信ネットワークへのインターフェースをさらに含むことができる。ネットワークは、例えば、無線、有線、光学的であり得る。ネットワークは、さらに、ローカル、広域、大都市圏、車両用および産業用、リアルタイム、遅延耐性などであり得る。ネットワークの例は、イーサネット、無線LANなどのローカルエリアネットワーク、GSM、3G、4G、5G、LTEなどを含むセルラーネットワーク、ケーブルTV、衛星TV、および地上放送TVを含むTV有線または無線広域デジタルネットワーク、CANBusを含む車両用や産業用などを含む。特定のネットワークは、一般に、特定の汎用データポートまたは周辺バス(1249)(例えば、コンピューターシステム(1200)のUSBポートなど)に接続された外部ネットワークインターフェースアダプターを必要とする。他のものは一般に、以下で説明するようにシステムバスに接続することにより、コンピューターシステム(1200)のコアに統合される(例えば、PCコンピューターシステムへのイーサネットインターフェースまたはスマートフォンコンピューターシステムへのセルラーネットワークインターフェース)。これらのネットワークのいずれかを用いて、コンピュータシステム(1200)は、他のエンティティと通信することができる。このような通信は、単方向、受信のみ(例えば、放送TV)、単方向の送信のみ(例えば、特定のCANbusデバイスへのCANbus)、または双方向、例えばローカルまたはワイドエリアデジタルネットワークを用いる他のコンピュータシステムへの送信であり得る。特定のプロトコルおよびプロトコルスタックを上述したこれらのネットワークおよびネットワークインターフェースのそれぞれで使用することができる。
前述のヒューマンインターフェースデバイス、人間がアクセス可能な記憶装置、およびネットワークインターフェースは、コンピュータシステム(1200)のコア(1240)に接続されることができる。
コア(1240)は、1つ以上の中央処理装置(CPU)(1241)、グラフィックスプロセッシングユニット(GPU)(1242)、フィールドプログラマブルゲートエリア(FPGA)(1243)の形態での専用プログラマブル処理ユニット、特定のタスクのためのハードウェアアクセラレータ(1244)などを含むことができる。これらのデバイスは、リードオンリーメモリ(ROM)(1245)、ランダムアクセスメモリ(1246)、非ユーザアクセス可能な内部ハードドライブ、SSDなどの内部大容量記憶装置(1247)とともに、システムバス(1248)を介して接続されてもよい。一部のコンピュータシステムでは、システムバス(1248)は、1つ以上の物理プラグの形態でアクセスでき、追加のCPU、GPUなどによる拡張を可能にする。周辺機器は、コアのシステムバス(1248)に直接、または周辺バス(1249)を介して接続されることができる。周辺バスのアーキテクチャは、PCI、USBなどを含む。
CPU(1241)、GPU(1242)、FPGA(1243)、およびアクセラレータ(1244)は、組み合わせて、前述のコンピュータコードを構成することができる特定の命令を実行することができる。そのコンピュータコードは、ROM(1245)またはRAM(1246)に記憶されることができる。推移データはRAM(1246)にも記憶できるが、永続データは、例えば、内部大容量ストレージ(1247)に記憶されることができる。1つ以上のCPU(1241)、GPU(1242)、大容量ストレージ(1247)、ROM(1245)、RAM(1246)などと密接に関連付けることができるキャッシュメモリを使用することにより、任意のメモリデバイスへの高速保存および検索が可能になる。
コンピュータ読取可能な媒体は、様々なコンピュータ実施操作を実行するためのコンピュータコードを備えることができる。媒体およびコンピュータコードは、本開示の目的のために特別に設計および構築されたものであり得るか、もしくは、それらは、コンピュータソフトウェア技術の当業者に周知であって利用可能な種類のものであり得る。
限定ではなく、一例として、アーキテクチャを有するコンピュータシステム(1200)、特にコア(1240)は、1つ以上の有形のコンピュータ読取可能な媒体に組み込まれたソフトウェアを実行するプロセッサ(CPU、GPU、FPGA、アクセラレータなどを含む)の結果としての機能性を提供することができる。このようなコンピュータ読取可能な媒体は、以上で紹介したようにユーザがアクセス可能な大容量ストレージ、および、コア内部大容量ストレージ(1247)またはROM(1245)などの非一時的な性質を持つコア(1240)の特定のストレージに関連付けられた媒体であり得る。本開示の様々な実施形態を実行するソフトウェアは、このようなデバイスに記憶され、コア(1240)によって実行されることができる。コンピュータ読取可能な媒体は、特定の必要に応じて、1つ以上のメモリデバイスまたはチップを含むことができる。ソフトウェアは、コア(1240)、具体的にはその中のプロセッサ(CPU、GPU、FPGAなどを含む)に、RAM(1246)に記憶されたデータ構造を定義すること、および、ソフトウェアで定義されたプロセスに従ってこのようなデータ構造を変更することを含む、ここで説明する特定のプロセスまたは特定のプロセスの特定の部分を実行させることができる。加えて、または、代替として、コンピュータシステムは、本明細書に記載された特定のプロセスまたは特定のプロセスの特定の部分を実行するためにソフトウェアの代わりにまたは一緒に動作することができる回路(例えば、アクセラレータ(1244))に有線接続されたまたは組み込まれたロジックの結果としての機能性を提供することができる。ソフトウェアへの言及は、必要に応じて、ロジックを含むことができ、その逆も同様である。コンピュータ読取可能な媒体への言及は、必要に応じて、実行のためのソフトウェアを記憶する回路(集積回路(IC)など)、実行のためのロジックを具現化する回路、またはその両方を含むことができる。本開示は、ハードウェアとソフトウェアの任意の適切な組み合わせを含む。
付録A:頭字語
MV:Motion Vector(動きベクトル)
HEVC:High Efficiency Video Coding(高効率ビデオ符号化)
SEI:Supplementary Enhancement Information(補助強化情報)
VUI:Video Usability Information(ビデオユーザビリティ情報)
GOP:Groups of Pictures(ピクチャ群)
TU:Transform Units(変換ユニット)

PU:Prediction Units(予測ユニット)
CTU:Coding Tree Units(符号化ツリーユニット)
CTB:Coding Tree Blocks(符号化ツリーブロック)
PB:Prediction Blocks(予測ブロック)
HRD:Hypothetical Reference Decoder(仮想参照デコーダ)
SNR:Signal Noise Ratio(信号対雑音比)
CPU:Central Processing Units(中央処理装置)
GPU:Graphics Processing Units(グラフィックスプロセッシングユニット)
CRT:Cathode Ray Tube(陰極線管)
LCD:Liquid-Crystal Display(液晶ディスプレイ)
OLED:Organic Light-Emitting Diode(有機発光ダイオード)
CD:Compact Disc(コンパクトディスク)
DVD:Digital Video Disc(デジタルビデオディスク)
ROM:Read-Only Memory(リードオンリーメモリ)
RAM:Random Access Memory(ランダムアクセスメモリ)
ASIC:Application-Specific Integrated Circuit(特定用途向け集積回路)
PLD:Programmable Logic Device(プログラマブルロジックデバイス)
LAN:Local Area Network(ローカルエリアネットワーク)
GSM:Global System for Mobile Communications(グローバルモバイル通信システム)
LTE:Long-Term Evolution(長期的な進化)
CANBus:Controller Area Network Bus(コントローラエリアネットワークバス)
USB:Universal Serial Bus(ユニバーサルシリアルバス)
PCI:Peripheral Component Interconnect(ペリフェラルコンポーネントインターコネクト)
FPGA:Field Programmable Gate Areas(フィールドプログラマブルゲートエリア)
SSD:Solid-State Drive(ソリッドステートドライブ)
IC:Integrated Circuit(集積回路)
CU:Coding Unit(符号化ユニット)
本開示は一部の例示的な実施形態を説明してきたが、本開示の範囲内に含まれる変更、置換、および様々な代替の均等物が存在する。したがって、当業者は、本明細書では明示的に示されていないか、または記載されていないが、本開示の原理を具現化し、その思想および範囲内に含まれる様々なシステムおよび方法を考案できることが理解されよう。
(1)ビデオデコーダ用のビデオデコード方法であって、前記ビデオデコーダは、処理回路を含み、前記方法は、前記処理回路により、彩度ブロックのブロックサイズがブロックサイズ閾値以下であるか否かを判定するステップと、前記彩度ブロックの前記ブロックサイズが前記ブロックサイズ閾値よりも大きいとの判定に応じて、複数のイントラ予測モードから前記彩度ブロック用のイントラ予測モードを選択するステップと、前記彩度ブロックの前記ブロックサイズが前記ブロックサイズ閾値以下であるとの判定に応じて、前記複数のイントラ予測モードのサブセットから前記彩度ブロック用の前記イントラ予測モードを選択するステップと、選択された前記イントラ予測モードで取得された彩度サンプルに基づいて、前記彩度ブロックのイントラ予測を実行するステップと、を含む方法。
(2)前記複数のイントラ予測モードの前記サブセットは、前記彩度ブロックに関連付けられた輝度ブロックのイントラ予測モードを再利用するダイレクトコピーモード(DM)からなる、前記(1)に記載の方法。
(3)前記複数のイントラ予測モードの前記サブセットは、前記彩度ブロックに関連付けられた輝度ブロックの輝度サンプルから前記彩度サンプルを導出する相互相関線形モデル(CCLM)モードからなり、前記輝度サンプルは、前記輝度ブロックのイントラ予測モードに従って取得される、前記(1)又は前記(2)に記載の方法。
(4)前記複数のイントラ予測モードの前記サブセットは、(i)前記彩度ブロックに関連付けられた輝度ブロックのイントラ予測モードを再利用するダイレクトコピーモード(DM)、および(ii)前記彩度ブロックに関連付けられた前記輝度ブロックの輝度サンプルから前記彩度サンプルを導出する相互相関線形モデル(CCLM)モード、のうちの1つであり、前記輝度サンプルは、前記輝度ブロックの前記イントラ予測モードに従って取得される、前記(1)から前記(3)の何れかに記載の方法。
(5)1ビットのインジケータは、前記DMおよび前記CCLMモードのどちらが使用されるかを示す、前記(4)に記載の方法。
(6)イントラ予測モードの前記サブセットは、(i)前記彩度ブロックに関連付けられた輝度ブロックのイントラ予測モードを再利用するダイレクトコピーモード(DM)、(ii)前記彩度ブロックに関連付けられた前記輝度ブロックの輝度サンプルから前記彩度サンプルを導出する相互相関線形モデル(CCLM)モード、および(iii)(a)平面モード、(b)DCモード、(c)水平モード、および(d)垂直モードのうちの一方であるイントラ予測モードのグループ、のうちの1つであり、前記輝度サンプルは、前記輝度ブロックの前記イントラ予測モードに従って取得される、前記(1)から前記(5)の何れかに記載の方法。
(7)前記ブロックサイズ閾値以下のブロックサイズを有する前記彩度ブロックについて、1つのDC係数のみがシグナリングされる、前記(1)から前記(6)の何れかに記載の方法。
(8)前記ブロックサイズ閾値以下のブロックサイズを有する前記彩度ブロックについて、変換係数がシグナリングされない、前記(1)から前記(7)の何れかに記載の方法。
(9)前記ブロックサイズ閾値は、N×Yであり、Nは、2より大きい整数であり、Yは、2より大きい整数であり、前記彩度ブロックの高さがN以下である、或いは、前記彩度ブロックの幅がY以下であるとの判定に応じて、前記彩度ブロックの前記ブロックサイズは、前記ブロックサイズ閾値以下である、前記(1)から前記(8)の何れかに記載の方法。
(10)前記ブロックサイズ閾値は、最小輝度イントラ符号化ブロックユニットサイズのブロック面積、ブロック幅、およびブロック高さのうちの1つである、前記(1)から前記(9)の何れかに記載の方法。
(11)前記彩度ブロックの前記ブロックサイズ閾値および前記ブロックサイズは、画素の数である、前記(1)から前記(10)の何れかに記載の方法。
(12)彩度ブロックのブロックサイズがブロックサイズ閾値以下であるか否かを判定し、前記彩度ブロックの前記ブロックサイズが前記ブロックサイズ閾値よりも大きいとの判定に応じて、複数のイントラ予測モードから前記彩度ブロック用のイントラ予測モードを選択し、前記彩度ブロックの前記ブロックサイズが前記ブロックサイズ閾値以下であるとの判定に応じて、前記複数のイントラ予測モードのサブセットから前記彩度ブロック用の前記イントラ予測モードを選択し、選択された前記イントラ予測モードで取得された彩度サンプルに基づいて、前記彩度ブロックのイントラ予測を実行するように構成される処理回路を備えるビデオデコードのためのビデオデコーダ。
(13)前記複数のイントラ予測モードの前記サブセットは、前記彩度ブロックに関連付けられた輝度ブロックのイントラ予測モードを再利用するダイレクトコピーモード(DM)からなる、前記(12)に記載のビデオデコーダ。
(14)前記複数のイントラ予測モードの前記サブセットは、前記彩度ブロックに関連付けられた輝度ブロックの輝度サンプルから前記彩度サンプルを導出する相互相関線形モデル(CCLM)モードからなり、前記輝度サンプルは、前記輝度ブロックのイントラ予測モードに従って取得される、前記(12)又は前記(13)に記載のビデオデコーダ。
(15)前記複数のイントラ予測モードの前記サブセットは、(i)前記彩度ブロックに関連付けられた輝度ブロックのイントラ予測モードを再利用するダイレクトコピーモード(DM)、および(ii)前記彩度ブロックに関連付けられた前記輝度ブロックの輝度サンプルから前記彩度サンプルを導出する相互相関線形モデル(CCLM)モード、のうちの1つであり、前記輝度サンプルは、前記輝度ブロックの前記イントラ予測モードに従って取得される、前記(12)から前記(14)の何れかに記載のビデオデコーダ。
(16)1ビットのインジケータは、前記DMおよび前記CCLMモードのどちらが使用されるかを示す、前記(15)に記載のビデオデコーダ。
(17)イントラ予測モードの前記サブセットは、(i)前記彩度ブロックに関連付けられた輝度ブロックのイントラ予測モードを再利用するダイレクトコピーモード(DM)、(ii)前記彩度ブロックに関連付けられた前記輝度ブロックの輝度サンプルから前記彩度サンプルを導出する相互相関線形モデル(CCLM)モード、および(iii)(a)平面モード、(b)DCモード、(c)水平モード、および(d)垂直モードのうちの一方であるイントラ予測モードのグループ、のうちの1つであり、前記輝度サンプルは、前記輝度ブロックのイントラ予測モードに従って取得される、前記(12)から前記(16)の何れかに記載のビデオデコーダ。
(18)前記ブロックサイズ閾値以下のブロックサイズを有する前記彩度ブロックについて、1つのDC係数のみがシグナリングされる、前記(12)から前記(17)の何れかに記載のビデオデコーダ。
(19)前記ブロックサイズ閾値以下のブロックサイズを有する前記彩度ブロックについて、変換係数がシグナリングされない、前記(12)から前記(18)の何れかに記載のビデオデコーダ。
(20)ビデオデコーダのプロセッサによって実行されると、前記プロセッサに、彩度ブロックのブロックサイズがブロックサイズ閾値以下であるか否かを判定するステップと、前記彩度ブロックの前記ブロックサイズが前記ブロックサイズ閾値よりも大きいとの判定に応じて、複数のイントラ予測モードから前記彩度ブロック用のイントラ予測モードを選択するステップと、前記彩度ブロックの前記ブロックサイズが前記ブロックサイズ閾値以下であるとの判定に応じて、前記複数のイントラ予測モードのサブセットから前記彩度ブロック用の前記イントラ予測モードを選択するステップと、選択された前記イントラ予測モードで取得された彩度サンプルに基づいて、前記彩度ブロックのイントラ予測を実行することと、を含む方法を実行させる命令が記憶されている非一時的なコンピュータ読取可能な媒体。

Claims (12)

  1. ビデオデコーダが実行するビデオ復号の方法であって、
    前記ビデオデコーダが、
    クロマブロックのブロックサイズがブロックサイズ閾値以下であるか否かを判定するステップと、
    前記クロマブロックの前記ブロックサイズが前記ブロックサイズ閾値よりも大きいとの判定に応じて、複数のイントラ予測モードから前記クロマブロック用のイントラ予測モードを選択するステップと、
    前記クロマブロックの前記ブロックサイズが前記ブロックサイズ閾値以下であるとの判定に応じて、前記複数のイントラ予測モードのサブセットから前記クロマブロック用の前記イントラ予測モードを選択するステップと、
    選択された前記イントラ予測モードで取得されたクロマサンプルに基づいて、前記クロマブロックのイントラ予測を行うステップと、
    を含み、
    前記ブロックサイズ閾値以下のブロックサイズを有する前記クロマブロックについて、1つのDC係数のみがシグナリングされる、方法。
  2. 前記複数のイントラ予測モードの前記サブセットは、前記クロマブロックに関連付けられたルーマブロックのイントラ予測モードを再利用するダイレクトコピーモード(DM)からなる、
    請求項1に記載の方法。
  3. 前記複数のイントラ予測モードの前記サブセットは、前記クロマブロックに関連付けられたルーマブロックのルーマサンプルから前記クロマサンプルを導出するクロスコンポーネント線形モデル(CCLM)モードからなり、前記ルーマサンプルは、前記ルーマブロックのイントラ予測モードに従って取得される、
    請求項1に記載の方法。
  4. 前記複数のイントラ予測モードの前記サブセットは、(i)前記クロマブロックに関連付けられたルーマブロックのイントラ予測モードを再利用するダイレクトコピーモード(DM)、および(ii)前記クロマブロックに関連付けられた前記ルーマブロックのルーマサンプルから前記クロマサンプルを導出するクロスコンポーネント線形モデル(CCLM)モードのうちの1つであり、前記ルーマサンプルは、前記ルーマブロックの前記イントラ予測モードに従って取得される、
    請求項1に記載の方法。
  5. 1ビットのインジケータにより、前記DMと前記CCLMモードのどちらが使用されるかを示す、
    請求項4に記載の方法。
  6. 前記複数のイントラ予測モードの前記サブセットは、(i)前記クロマブロックに関連付けられたルーマブロックのイントラ予測モードを再利用するダイレクトコピーモード(DM)、(ii)前記クロマブロックに関連付けられた前記ルーマブロックのルーマサンプルから前記クロマサンプルを導出するクロスコンポーネント線形モデル(CCLM)モード、および(iii)(a)平面モード、(b)DCモード、(c)水平モード、および(d)垂直モードのうちの一方であるイントラ予測モードのグループ、のうちの1つであり、
    前記ルーマサンプルは、前記ルーマブロックの前記イントラ予測モードに従って取得される、
    請求項1に記載の方法。
  7. 前記ブロックサイズ閾値以下のブロックサイズを有する前記クロマブロックについて、変換係数がシグナリングされない、
    請求項1~6の何れか一項に記載の方法。
  8. 前記ブロックサイズ閾値は、N×Yであり、Nは、2より大きい整数であり、Yは、2より大きい整数であり、
    前記クロマブロックの高さがN以下である、或いは、前記クロマブロックの幅がY以下であるとの判定に応じて、前記クロマブロックの前記ブロックサイズは、前記ブロックサイズ閾値以下である、
    請求項1~の何れか一項に記載の方法。
  9. 前記ブロックサイズ閾値は、最小ルーマイントラ符号化ブロックユニットサイズのブロック面積、ブロック幅、およびブロック高さのうちの1つである、
    請求項1~の何れか一項に記載の方法。
  10. 前記クロマブロックの前記ブロックサイズ閾値および前記ブロックサイズは、画素の数である、請求項1~の何れか一項に記載の方法。
  11. 処理回路を備えるビデオデコーダであって、
    前記処理回路は、請求項1~1の何れか一項に記載の方法を実行するように構成される、ビデオデコーダ。
  12. コンピュータに、請求項1~1の何れか一項に記載の方法を実行させるためのプログラム。
JP2020555778A 2018-05-02 2019-05-01 小ブロックの予測と変換のための方法、装置、及びプログラム Active JP7046220B2 (ja)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201862665858P 2018-05-02 2018-05-02
US62/665,858 2018-05-02
US16/200,362 2018-11-26
US16/200,362 US10609402B2 (en) 2018-05-02 2018-11-26 Method and apparatus for prediction and transform for small blocks
PCT/US2019/030117 WO2019213198A1 (en) 2018-05-02 2019-05-01 Method and apparatus for prediction and transform for small blocks

Publications (2)

Publication Number Publication Date
JP2021518088A JP2021518088A (ja) 2021-07-29
JP7046220B2 true JP7046220B2 (ja) 2022-04-01

Family

ID=68384077

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2020555778A Active JP7046220B2 (ja) 2018-05-02 2019-05-01 小ブロックの予測と変換のための方法、装置、及びプログラム

Country Status (6)

Country Link
US (3) US10609402B2 (ja)
EP (1) EP3788786A1 (ja)
JP (1) JP7046220B2 (ja)
KR (1) KR102474158B1 (ja)
CN (1) CN111869212B (ja)
WO (1) WO2019213198A1 (ja)

Families Citing this family (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116347109A (zh) * 2018-08-17 2023-06-27 北京字节跳动网络技术有限公司 一种处理视频数据的方法和装置
TWI820212B (zh) 2018-09-12 2023-11-01 大陸商北京字節跳動網絡技術有限公司 單行交叉分量線性模型預測模式
KR20210087928A (ko) 2018-11-06 2021-07-13 베이징 바이트댄스 네트워크 테크놀로지 컴퍼니, 리미티드 인트라 예측을 위한 파라미터 유도의 복잡성 감소
CN113170122B (zh) 2018-12-01 2023-06-27 北京字节跳动网络技术有限公司 帧内预测的参数推导
CA3121671A1 (en) 2018-12-07 2020-06-11 Beijing Bytedance Network Technology Co., Ltd. Context-based intra prediction
AU2018454766A1 (en) * 2018-12-25 2021-04-08 Guangdong Oppo Mobile Telecommunications Corp., Ltd. Decoding prediction method and apparatus, and computer storage medium
WO2020141985A1 (en) * 2018-12-31 2020-07-09 Huawei Technologies Co., Ltd. Method and apparatus of cross-component linear modeling for intra prediction
EP3883243A4 (en) 2019-01-02 2021-12-01 Guangdong Oppo Mobile Telecommunications Corp., Ltd. METHOD AND DEVICE FOR INTRAFRAME CHROMATICITY PREDICTION AND COMPUTER STORAGE MEDIUM
JP2022521698A (ja) * 2019-02-22 2022-04-12 北京字節跳動網絡技術有限公司 イントラ予測のための隣接サンプル選択
CN115967810A (zh) 2019-02-24 2023-04-14 抖音视界有限公司 对视频数据进行编解码的方法、设备及计算机可读介质
EP3932063A1 (en) 2019-02-28 2022-01-05 InterDigital VC Holdings, Inc. Method and device for picture encoding and decoding
CN117880494A (zh) 2019-03-24 2024-04-12 北京字节跳动网络技术有限公司 用于帧内预测的参数推导的条件
US11394990B2 (en) 2019-05-09 2022-07-19 Tencent America LLC Method and apparatus for signaling predictor candidate list size
US11134275B2 (en) 2019-06-04 2021-09-28 Tencent America LLC Method and apparatus for performing primary transform based on filtering of blocks
US11212545B2 (en) 2019-06-07 2021-12-28 Tencent America LLC Method and apparatus for improved implicit transform selection
US11356675B2 (en) 2019-07-11 2022-06-07 Tencent America LLC Method and apparatus for video coding
US11616962B2 (en) 2019-07-15 2023-03-28 Tencent America LLC Method and apparatus for video coding
US11375243B2 (en) 2019-07-17 2022-06-28 Tencent America LLC Method and apparatus for video coding
US11228768B2 (en) * 2019-08-14 2022-01-18 Qualcomm Incorporated Restriction on block size of lossless coding
US11310511B2 (en) 2019-10-09 2022-04-19 Tencent America LLC Method and apparatus for video coding
US11206428B1 (en) 2020-07-14 2021-12-21 Tencent America LLC Method and apparatus for frequency-dependent joint component secondary transform
US11575937B2 (en) 2020-07-24 2023-02-07 Tencent America LLC Methods for efficient application of LGT
US11310504B2 (en) 2020-07-30 2022-04-19 Tencent America LLC Complexity reduction for 32-p and 64-p LGT
US20240114148A1 (en) * 2020-11-16 2024-04-04 Hyundai Motor Company Video encoding and decoding method for adaptively determining chroma intra directional prediction mode
US20240007620A1 (en) * 2020-11-23 2024-01-04 Hyundai Motor Company Image encoding and decoding method using adaptive alternative mode
US20240007645A1 (en) * 2020-11-23 2024-01-04 Hyundai Motor Company Video encoding and decoding method using adaptive reference pixel selection
US20230099292A1 (en) * 2021-09-29 2023-03-30 Malini MANOCHA Detection and management of dysfunctions in subterranean operations
WO2023200155A1 (ko) * 2022-04-12 2023-10-19 엘지전자 주식회사 영상 부호화/복호화 방법, 비트스트림을 전송하는 방법 및 비트스트림을 저장한 기록 매체

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018035130A1 (en) 2016-08-15 2018-02-22 Qualcomm Incorporated Intra video coding using a decoupled tree structure
WO2018053293A1 (en) 2016-09-15 2018-03-22 Qualcomm Incorporated Linear model chroma intra prediction for video coding
WO2018064956A1 (en) 2016-10-07 2018-04-12 Mediatek Inc. Method and apparatus for intra chroma coding in image and video coding

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8526495B2 (en) 2010-11-22 2013-09-03 Mediatek Singapore Pte. Ltd. Apparatus and method of constrained partition size for high efficiency video coding
BR122021004598B1 (pt) * 2010-12-23 2022-08-16 Samsung Electronics Co., Ltd Aparelho para decodificar uma imagem
US9049452B2 (en) 2011-01-25 2015-06-02 Mediatek Singapore Pte. Ltd. Method and apparatus for compressing coding unit in high efficiency video coding
US9788019B2 (en) 2011-03-09 2017-10-10 Hfi Innovation Inc. Method and apparatus of transform unit partition with reduced complexity
CN103748877B (zh) 2011-08-17 2017-05-10 联发科技(新加坡)私人有限公司 帧内预测方法和装置
KR20130058524A (ko) * 2011-11-25 2013-06-04 오수미 색차 인트라 예측 블록 생성 방법
US9667994B2 (en) * 2012-10-01 2017-05-30 Qualcomm Incorporated Intra-coding for 4:2:2 sample format in video coding
CN104484085B (zh) 2014-12-22 2018-05-25 上海天马微电子有限公司 一种电容式触摸屏、其触摸定位方法及显示装置
WO2017088093A1 (en) * 2015-11-23 2017-06-01 Mediatek Singapore Pte. Ltd. On the smallest allowed block size in video coding
US10212444B2 (en) 2016-01-15 2019-02-19 Qualcomm Incorporated Multi-type-tree framework for video coding
US11032550B2 (en) * 2016-02-25 2021-06-08 Mediatek Inc. Method and apparatus of video coding
US11223852B2 (en) 2016-03-21 2022-01-11 Qualcomm Incorporated Coding video data using a two-level multi-type-tree framework
US20180041778A1 (en) * 2016-08-02 2018-02-08 Qualcomm Incorporated Geometry transformation-based adaptive loop filtering
US10326986B2 (en) * 2016-08-15 2019-06-18 Qualcomm Incorporated Intra video coding using a decoupled tree structure
US10506228B2 (en) * 2016-10-04 2019-12-10 Qualcomm Incorporated Variable number of intra modes for video coding
US11218727B2 (en) * 2019-07-11 2022-01-04 Tencent America LLC Method and apparatus for predictor candidate list size signaling for intra picture block compensation

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018035130A1 (en) 2016-08-15 2018-02-22 Qualcomm Incorporated Intra video coding using a decoupled tree structure
WO2018053293A1 (en) 2016-09-15 2018-03-22 Qualcomm Incorporated Linear model chroma intra prediction for video coding
WO2018064956A1 (en) 2016-10-07 2018-04-12 Mediatek Inc. Method and apparatus for intra chroma coding in image and video coding

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
Liang Zhao, Xin Zhao, Xiang Li, and Shan Liu,CE3 related: Simplifications for chroma intra coding,Joint Video Exploration Team (JVET) of ITU-T SG 16 WP 3 and ISO/IEC JTC 1/SC 29/WG 11,JVET-K0293_v2,11th Meeting: Ljubljana, SI,2018年07月,pp.1-2

Also Published As

Publication number Publication date
EP3788786A4 (en) 2021-03-10
US20200195949A1 (en) 2020-06-18
EP3788786A1 (en) 2021-03-10
CN111869212B (zh) 2022-07-15
JP2021518088A (ja) 2021-07-29
US11665359B2 (en) 2023-05-30
US10609402B2 (en) 2020-03-31
CN111869212A (zh) 2020-10-30
KR20200125724A (ko) 2020-11-04
US20190342568A1 (en) 2019-11-07
WO2019213198A1 (en) 2019-11-07
US11259039B2 (en) 2022-02-22
US20220060728A1 (en) 2022-02-24
KR102474158B1 (ko) 2022-12-02

Similar Documents

Publication Publication Date Title
JP7046220B2 (ja) 小ブロックの予測と変換のための方法、装置、及びプログラム
JP7443455B2 (ja) 映像復号化のための方法、装置及びコンピュータ・プログラム
JP7339389B2 (ja) ビデオ圧縮における複数ラインのフレーム内予測のための方法および装置
KR102637562B1 (ko) 비디오 압축에서의 비-정사각형 블록들에 대한 인트라 예측을 위한 방법 및 장치
JP7242705B2 (ja) ビデオ符号化のための方法、装置、及びコンピュータプログラム
KR102442931B1 (ko) 비디오 코딩을 위한 방법 및 장치
JP2022516846A (ja) アフィン線形加重イントラ予測モードのための簡易シグナリング方法
JP7257516B2 (ja) ビデオ・コーディングのための方法、装置及びコンピュータ・プログラム
KR102454760B1 (ko) 비디오 코딩을 위한 방법 및 장치
JP2022059032A (ja) ビデオエンコーディング及びデコーディングのための方法、装置、コンピュータプログラム、及び非一時的なコンピュータ可読媒体
JP2022521516A (ja) ビデオコーディングのための方法およびコンピュータプログラム
JP7080434B2 (ja) サブブロックの動きベクトル予測の方法、並びにその装置及びコンピュータプログラム
JP2022526161A (ja) ビデオ・コーディング方法及び装置
JP7244670B2 (ja) デコーダが実行するビデオデコーディングのための方法、装置及び非一時的なコンピュータ可読媒体、並びにエンコーダが実行するビデオエンコーディングのための方法
JP2022515799A (ja) ビデオ復号の方法および装置、並びにプログラム
JP2022525748A (ja) ビデオ符号化のための色変換
JP2022515850A (ja) 統合位置依存予測組み合わせプロセスを使用するデコードのための方法、装置およびコンピュータ・プログラム
JP2022522683A (ja) ビデオコーディングのための方法並びにその、装置およびコンピュータプログラム
JP2022526380A (ja) スキップモードフラグを伝達するための方法、装置及びコンピュータプログラム
JP2022512088A (ja) ビデオコーディングのための方法、装置、およびプログラム
JP7236558B2 (ja) ビデオコーディングのための方法および装置
JP7395771B2 (ja) テンプレートマッチングベースのイントラ予測
KR102461780B1 (ko) 비디오 코딩을 위한 방법 및 장치
JP2022525056A (ja) ビデオ符号化方法、装置及びコンピュータプログラム
JP7325622B2 (ja) 映像コーディングのための方法、装置、及びコンピュータプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20201012

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20211109

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20211116

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220208

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20220315

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20220322

R150 Certificate of patent or registration of utility model

Ref document number: 7046220

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150