JP2014534734A - イントラ予測ビデオコーディングにおける非正方形変換 - Google Patents

イントラ予測ビデオコーディングにおける非正方形変換 Download PDF

Info

Publication number
JP2014534734A
JP2014534734A JP2014539000A JP2014539000A JP2014534734A JP 2014534734 A JP2014534734 A JP 2014534734A JP 2014539000 A JP2014539000 A JP 2014539000A JP 2014539000 A JP2014539000 A JP 2014539000A JP 2014534734 A JP2014534734 A JP 2014534734A
Authority
JP
Japan
Prior art keywords
transform
video
partition
prediction
square
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2014539000A
Other languages
English (en)
Other versions
JP5886440B2 (ja
Inventor
グオ、リウェイ
ワン、シャンリン
カークゼウィックズ、マルタ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Qualcomm Inc
Original Assignee
Qualcomm Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qualcomm Inc filed Critical Qualcomm Inc
Publication of JP2014534734A publication Critical patent/JP2014534734A/ja
Application granted granted Critical
Publication of JP5886440B2 publication Critical patent/JP5886440B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/11Selection of coding mode or of prediction mode among a plurality of spatial predictive coding modes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/12Selection from among a plurality of transforms or standards, e.g. selection between discrete cosine transform [DCT] and sub-band transform or selection between H.263 and H.264
    • H04N19/122Selection of transform size, e.g. 8x8 or 2x4x8 DCT; Selection of sub-band transforms of varying structure or type
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Discrete Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

本開示では、イントラコード化ブロックで非正方形変換区分を可能にするビデオ符号化プロセスにおいて変換区分を決定するための技法について説明する。本開示の一例によれば、ビデオ符号化方法は、コーディングユニットを複数の予測ユニットに区分することと、予測ユニットの各々の変換区分を決定することであって、少なくとも1つの変換区分が非正方形区分であることとを備える。

Description

関連出願
本出願は、その内容全体が参照により本明細書に組み込まれる、2011年10月27日に出願された米国仮出願第61/552,327号の利益を主張する。
本開示は、ビデオコーディングに関し、より詳細には、ビデオデータをコーディングするときにイントラ予測を実行するための技法に関する。
デジタルビデオ機能は、デジタルテレビジョン、デジタルダイレクトブロードキャストシステム、ワイヤレスブロードキャストシステム、携帯情報端末(PDA)、ラップトップまたはデスクトップコンピュータ、デジタルカメラ、デジタル記録デバイス、デジタルメディアプレーヤ、ビデオゲームデバイス、ビデオゲームコンソール、セルラー電話または衛星無線電話、ビデオ遠隔会議デバイスなどを含む、広範囲にわたるデバイスに組み込まれ得る。デジタルビデオデバイスは、デジタルビデオ情報をより効率的に送信、受信および記憶するための、MPEG−2、MPEG−4、ITU−T H.263、ITU−T H.264/MPEG−4、Part 10、Advanced Video Coding(AVC)によって定義された規格、現在開発中の高効率ビデオコーディング(HEVC:High Efficiency Video Coding)規格、およびそのような規格の拡張に記載されているビデオ圧縮技法など、ビデオ圧縮技法を実装(implement)する。
ビデオ圧縮技法は、ビデオシーケンスに固有の冗長性を低減または除去するために空間的予測および/または時間的予測を含む。ブロックベースのビデオコーディングの場合、ビデオフレームまたはスライスはブロックに区分され得る。各ブロックはさらに区分され得る。イントラコード化(I)フレームまたはスライス中のブロックは、同じフレームまたはスライス中の隣接ブロック中の参照サンプルに対する空間的予測を使用して符号化される。インターコード化(PまたはB)フレームまたはスライス中のブロックは、同じフレームまたはスライス中の隣接ブロック中の参照サンプルに対する空間的予測、あるいは他の参照フレーム中の参照サンプルに対する時間的予測を使用し得る。空間的予測または時間的予測は、コーディングされるべきブロックの予測ブロックを生じる。残差データは、コーディングされるべき元のブロックと予測ブロックとの間のピクセル差分を表す。
インターコード化ブロックは、予測ブロックを形成する参照サンプルのブロックを指す動きベクトル、およびコード化ブロックと予測ブロックとの間の差分を示す残差データに従って符号化される。イントラコード化ブロックは、イントラコーディングモードと残差データとに従って符号化される。さらなる圧縮のために、残差データは、ピクセル領域から変換領域に変換されて、残差変換係数が得られ得、その残差変換係数は、次いで量子化され得る。最初は2次元アレイに構成される量子化された変換係数は、エントロピーコーディングのための変換係数の1次元ベクトルを生成するために、特定の順序で走査され得る。
概して、本開示では、ビデオデータをコーディングするための技法について説明する。本開示では、非正方形変換区分を可能にするビデオ符号化プロセスにおいて変換区分を選択するための技法について説明する。
本開示の一例によれば、ビデオ符号化方法は、コーディングユニットを複数の予測ユニットに区分することであって、コーディングユニットがイントラ予測(intra-prediction)を使用して符号化されることと、予測ユニットの各々の変換区分を決定することであって、少なくとも1つの変換区分が非正方形区分であることとを含む。一例では、複数の予測ユニットの各々は同じ変換区分を有する。別の例では、複数の予測ユニットの各々の変換区分は別々に決定される。一例では、シンタックス要素(syntax elements)は、区分のタイプ(たとえば、正方形または非正方形)と、非正方形区分の場合に区分の方向(たとえば、垂直方向または水平方向)とを示すためにシグナリングされる。
本開示の別の例によれば、ビデオ復号方法は、コーディングユニットを複数の予測ユニットに区分することであって、コーディングユニットがイントラ予測を使用して符号化されることと、予測ユニットの各々の変換区分を決定することであって、少なくとも1つの変換区分が非正方形区分であることとを含む。一例では、複数の予測ユニットの各々は同じ変換区分を有する。別の例では、複数の予測ユニットの各々の変換区分は別々に決定される。一例では、シンタックス要素は、区分のタイプ(たとえば、正方形または非正方形)と、非正方形区分の場合に区分の方向(たとえば、垂直方向または水平方向)とを示すために符号化ビデオビットストリームで受信される。
本開示ではまた、開示した方法を実行するように構成された装置、デバイス、およびコンピュータ可読記憶媒体について説明する。
1つまたは複数の例の詳細は、添付の図面および以下の説明に記載されている。他の特徴、目的、および利点は、その説明および図面、ならびに特許請求の範囲から明らかになろう。
例示的なビデオ符号化および復号システムを示すブロック図。 例示的なイントラ予測モード方向を示す概念図。 イントラ予測のための例示的な予測ユニットの概念図。 例示的な4分木ブロック構造の概念図。 イントラ予測されたブロックの例示的な正方形変換ユニット区分の概念図。 イントラ予測されたブロックの例示的な非正方形変換区分の概念図。 N×N予測ユニットの例示的な非正方形変換区分の概念図。 N×N予測ユニットの別の例示的な非正方形変換区分の概念図。 変換区分のさらなる分割の一例の概念図。 変換区分のさらなる分割の別の例の概念図。 変換区分のさらなる分割の別の例の概念図。 例示的なビデオエンコーダを示すブロック図。 例示的なビデオデコーダを示すブロック図。 本開示の技法による例示的なビデオ符号化方法を示すフローチャート。 本開示の技法による例示的なビデオ復号方法を示すフローチャート。
概して、本開示では、ビデオデータをコーディングするための技法について説明する。いくつかの例では、本開示では、非正方形変換区分を可能にするビデオコーディングプロセスにおいて変換区分(transform partitions)を選択するための技法について説明する。本開示の技法は、イントラ予測ビデオコーディング(intra-prediction video coding)において非正方形変換区分を選択し使用し、したがって、コーディング圧縮および/またはビデオ品質を改善するためのさらなる機会を与える、より柔軟な手法を可能にする。 図1は、本開示の例によるイントラ予測コーディング(intra-prediction coding)のための技法を利用するように構成され得る例示的なビデオ符号化および復号システム10を示すブロック図である。図1に示すように、システム10は、通信チャネル16を介して符号化ビデオを宛先デバイス14に送信するソースデバイス12を含む。符号化ビデオデータはまた、記憶媒体34またはファイルサーバ36に記憶され得、必要に応じて宛先デバイス14によってアクセスされ得る。記憶媒体またはファイルサーバに記憶されたとき、ビデオエンコーダ20は、コード化ビデオデータを記憶媒体に記憶するための、ネットワークインターフェース、コンパクトディスク(CD)、ブルーレイ(登録商標)またはデジタルビデオディスク(DVD)バーナーまたはスタンピングファシリティデバイス、あるいは他のデバイスなど、別のデバイスにコード化ビデオデータを与え得る。同様に、ネットワークインターフェース、CDまたはDVDリーダーなど、ビデオデコーダ30とは別個のデバイスが、記憶媒体からコード化ビデオデータを取り出し、取り出されたデータをビデオデコーダ30に与え得る。
ソースデバイス12および宛先デバイス14は、デスクトップコンピュータ、ノートブック(すなわち、ラップトップ)コンピュータ、タブレットコンピュータ、セットトップボックス、いわゆるスマートフォンなどの電話ハンドセット、テレビジョン、カメラ、ディスプレイデバイス、デジタルメディアプレーヤ、ビデオゲームコンソールなどを含む、多種多様なデバイスのいずれかを備え得る。多くの場合、そのようなデバイスはワイヤレス通信用に装備され得る。したがって、通信チャネル16は、符号化ビデオデータの送信に好適なワイヤレスチャネル、ワイヤードチャネル、またはワイヤレスチャネルとワイヤードチャネルとの組合せを備え得る。同様に、ファイルサーバ36は、インターネット接続を含む任意の標準的なデータ接続を通じて宛先デバイス14によってアクセスされ得る。これは、ファイルサーバに記憶された符号化ビデオデータにアクセスするのに好適であるワイヤレスチャネル(たとえば、Wi−Fi接続)、ワイヤード接続(たとえば、DSL、ケーブルモデムなど)、または両方の組合せを含み得る。
本開示の例による、イントラ予測コーディングのための技法は、オーバージエアテレビジョン放送、ケーブルテレビジョン送信、衛星テレビジョン送信、たとえばインターネットを介したストリーミングビデオ送信、データ記憶媒体に記憶するためのデジタルビデオの符号化、データ記憶媒体に記憶されたデジタルビデオの復号、または他の適用例など、様々なマルチメディア適用例のいずれかをサポートするビデオコーディングに適用され得る。いくつかの例では、システム10は、ビデオストリーミング、ビデオ再生、ビデオブロードキャスティング、および/またはビデオテレフォニーなどの適用例をサポートするために、一方向または双方向のビデオ送信をサポートするように構成され得る。
図1の例では、ソースデバイス12は、ビデオソース18と、ビデオエンコーダ20と、変調器/復調器22と、送信機24とを含む。ソースデバイス12において、ビデオソース18は、ビデオカメラなどのビデオキャプチャデバイス、以前にキャプチャされたビデオを含んでいるビデオアーカイブ、ビデオコンテンツプロバイダからビデオを受信するためのビデオフィードインターフェース、および/または、ソースビデオとしてコンピュータグラフィックスデータを生成するためのコンピュータグラフィックスシステムなどのソース、またはそのようなソースの組合せを含み得る。一例として、ビデオソース18がビデオカメラである場合、ソースデバイス12および宛先デバイス14は、いわゆるカメラフォンまたはビデオフォンを形成し得る。ただし、本開示で説明する技法は、概してビデオコーディングに適用可能であり得、ワイヤレスおよび/またはワイヤード適用例、あるいは符号化ビデオデータがローカルディスクに記憶された適用例に適用され得る。
キャプチャされたビデオ、以前にキャプチャされたビデオ、またはコンピュータ生成されたビデオは、ビデオエンコーダ20によって符号化され得る。符号化ビデオ情報は、ワイヤレス通信プロトコルなどの通信規格に従ってモデム22によって変調され、送信機24を介して宛先デバイス14に送信され得る。モデム22は、信号変調のために設計された様々なミキサ、フィルタ、増幅器または他の構成要素を含み得る。送信機24は、増幅器、フィルタ、および1つまたは複数のアンテナを含む、データを送信するために設計された回路を含み得る。
ビデオエンコーダ20によって符号化された、キャプチャされたビデオ、以前にキャプチャされたビデオ、またはコンピュータ生成されたビデオはまた、後で消費するために記憶媒体34またはファイルサーバ36に記憶され得る。記憶媒体34は、ブルーレイディスク、DVD、CD−ROM、フラッシュメモリ、または符号化ビデオを記憶するための任意の他の好適なデジタル記憶媒体を含み得る。記憶媒体34に記憶された符号化ビデオは、次いで、復号および再生のために宛先デバイス14によってアクセスされ得る。
ファイルサーバ36は、符号化ビデオを記憶すること、およびその符号化ビデオを宛先デバイス14に送信することが可能な、任意のタイプのサーバであり得る。例示的なファイルサーバは、(たとえば、ウェブサイトのための)ウェブサーバ、FTPサーバ、ネットワーク接続ストレージ(NAS)デバイス、ローカルディスクドライブ、または、符号化ビデオデータを記憶すること、および符号化ビデオデータを宛先デバイスに送信することが可能な任意の他のタイプのデバイスを含む。ファイルサーバ36からの符号化ビデオデータの送信は、ストリーミング送信、ダウンロード送信、または両方の組合せであり得る。ファイルサーバ36は、インターネット接続を含む任意の標準的なデータ接続を通じて宛先デバイス14によってアクセスされ得る。これは、ファイルサーバに記憶された符号化ビデオデータにアクセスするのに好適である、ワイヤレスチャネル(たとえば、Wi−Fi接続)、ワイヤード接続(たとえば、DSL、ケーブルモデム、イーサネット(登録商標)、USBなど)、または両方の組合せを含み得る。
宛先デバイス14は、図1の例では、受信機26と、モデム28と、ビデオデコーダ30と、ディスプレイデバイス32とを含む。宛先デバイス14の受信機26はチャネル16を介して情報を受信し、モデム28はその情報を復調して、ビデオデコーダ30のための復調されたビットストリームを生成する。チャネル16を介して通信される情報は、ビデオデータを復号する際にビデオデコーダ30が使用する、ビデオエンコーダ20によって生成された様々なシンタックス情報を含み得る。そのようなシンタックスはまた、記憶媒体34またはファイルサーバ36に記憶される符号化ビデオデータとともに含まれ得る。ビデオエンコーダ20およびビデオデコーダ30の各々は、ビデオデータを符号化または復号することが可能であるそれぞれのエンコーダデコーダ(コーデック)の一部を形成し得る。
ディスプレイデバイス32は、宛先デバイス14と一体化されるかまたはその外部にあり得る。いくつかの例では、宛先デバイス14は、一体型ディスプレイデバイスを含み、また、外部ディスプレイデバイスとインターフェースするように構成され得る。他の例では、宛先デバイス14はディスプレイデバイスであり得る。概して、ディスプレイデバイス32は、復号ビデオデータ(decoded video data)をユーザに対して表示し、液晶ディスプレイ(LCD)、プラズマディスプレイ、有機発光ダイオード(OLED)ディスプレイ、または別のタイプのディスプレイデバイスなど、様々なディスプレイデバイスのいずれかを備え得る。
図1の例では、通信チャネル16は、無線周波数(RF)スペクトルあるいは1つまたは複数の物理伝送線路など、任意のワイヤレスまたはワイヤード通信媒体、あるいはワイヤレス媒体とワイヤード媒体との任意の組合せを備え得る。通信チャネル16は、ローカルエリアネットワーク、ワイドエリアネットワーク、またはインターネットなどのグローバルネットワークなど、パケットベースのネットワークの一部を形成することができる。通信チャネル16は、概して、ワイヤード媒体またはワイヤレス媒体の任意の好適な組合せを含む、ビデオデータをソースデバイス12から宛先デバイス14に送信するための任意の好適な通信媒体、または様々な通信媒体の集合体を表す。通信チャネル16は、ソースデバイス12から宛先デバイス14への通信を可能にするのに有用であり得るルータ、スイッチ、基地局、または任意の他の機器を含み得る。
ビデオエンコーダ20およびビデオデコーダ30は、ITU−T Video Coding Experts Group(VCEG)のJoint Collaboration Team on Video Coding(JCT−VC)によって現在開発中の高効率ビデオコーディング(HEVC)規格およびISO/IEC Motion Picture Experts Group(MPEG)などのビデオ圧縮規格に従って動作し得る。以下でHEVC WD8と呼ぶ、HEVCの最近の最新のワーキングドラフト(WD)は、2012年9月24日現在のhttp://phenix.int−evry.fr/jct/doc_end_user/documents/10_Stockholm/wg11/JCTVC−J1003−v8.zipから入手可能である。ビデオエンコーダ20およびビデオデコーダ30は、HEVCテストモデル(HM:HEVC Test Model)に準拠し得る。代替的に、ビデオエンコーダ20およびビデオデコーダ30は、代替的にMPEG−4、Part 10、Advanced Video Coding(AVC)と呼ばれるITU−T H.264規格など、他のプロプライエタリ規格または業界規格、あるいはそのような規格の拡張に従って動作し得る。ただし、本開示の技法は、いかなる特定のコーディング規格にも限定されない。他の例にはMPEG−2およびITU−T H.263がある。
図1には示されていないが、いくつかの態様では、ビデオエンコーダ20およびビデオデコーダ30は、それぞれオーディオエンコーダおよびデコーダと統合され得、適切なMUX−DEMUXユニット、または他のハードウェアおよびソフトウェアを含んで、共通のデータストリームまたは別個のデータストリーム中のオーディオとビデオの両方の符号化を処理し得る。適用可能な場合、いくつかの例では、MUX−DEMUXユニットは、ITU H.223マルチプレクサプロトコル、またはユーザデータグラムプロトコル(UDP)などの他のプロトコルに準拠し得る。
ビデオエンコーダ20およびビデオデコーダ30はそれぞれ、1つまたは複数のマイクロプロセッサ、デジタル信号プロセッサ(DSP)、特定用途向け集積回路(ASIC)、フィールドプログラマブルゲートアレイ(FPGA)、ディスクリート論理、ソフトウェア、ハードウェア、ファームウェアなど、様々な好適なエンコーダ回路のいずれか、あるいはそれらの任意の組合せとして実装され得る。本技法が部分的にソフトウェアで実装されるとき、デバイスは、好適な非一時的コンピュータ可読媒体にソフトウェアの命令を記憶し、1つまたは複数のプロセッサを使用してその命令をハードウェアで実行して、本開示の技法を実行し得る。ビデオエンコーダ20およびビデオデコーダ30の各々は1つまたは複数のエンコーダまたはデコーダ中に含まれ得、そのいずれも、それぞれのデバイスにおいて複合エンコーダ/デコーダ(コーデック)の一部として統合され得る。
ビデオエンコーダ20は、ビデオ符号化プロセスにおけるイントラ予測コーディングのための本開示の技法のいずれかまたはすべてを実装し得る。同様に、ビデオデコーダ30は、ビデオコーディングプロセスにおけるイントラ予測コーディングのためのこれらの技法のいずれかまたはすべてを実装し得る。本開示で説明するビデオコーダは、ビデオエンコーダまたはビデオデコーダを指し得る。同様に、ビデオコーディングユニットは、ビデオエンコーダまたはビデオデコーダを指し得る。同様に、ビデオコーディングはビデオ符号化またはビデオ復号を指し得る。
本開示の技法によれば、ビデオエンコーダ20は、コーディングユニット(coding unit)を複数の予測ユニットに区分することであって、コーディングユニットがイントラ予測(intra-prediction)を使用して符号化されることと、予測ユニットの各々の変換区分を決定することであって、予測ユニットの変換区分のうちの少なくとも1つが非正方形区分(non-square partition)であることとを行うように構成され得る。
同様に、本開示の技法によれば、ビデオデコーダ30は、コーディングユニットを複数の予測ユニットに区分することであって、コーディングユニットがイントラ予測を使用して符号化されることと、予測ユニットの各々の変換区分を決定することであって、予測ユニットの変換区分のうちの少なくとも1つが非正方形区分であることとを行うように構成され得る。ビデオデコーダ30は、変換タイプを示す第1のシンタックス要素を受信することであって、変換タイプが正方形変換区分(square transform partition)および非正方形変換区分(non-square transform partition)のうちの少なくとも1つから選択されることと、第1のシンタックス要素が非正方形変換タイプ(non-square transform type)を示す場合、非正方形変換タイプを有する各変換区分の変換方向を示す第2のシンタックス要素を受信することであって、変換方向が水平方向に配向した方向および垂直方向に配向した方向のうちの少なくとも1つから選択されることと、コーディングユニットを複数の予測ユニットに区分することであって、コーディングユニットがイントラ予測を使用して符号化されることと、受信した第1および第2のシンタックス要素に従って予測ユニットの各々の変換区分を決定することとを行うようにさらに構成され得る。
図1のビデオ符号化および復号システム10などのデジタルビデオデバイスは、ビデオ圧縮技法を実施して、デジタルビデオ情報をより効率的に符号化し、復号する。ビデオ圧縮は、ビデオシーケンスに固有の冗長性を低減または除去するために空間的(フレーム内)予測および/または時間的(フレーム間)予測技法を適用し得る。
典型的なビデオエンコーダは、元のビデオシーケンスの各フレームを、「ブロック」または「コーディングユニット」と呼ばれる連続矩形領域に区分する。これらのブロックは、「イントラモード」(Iモード、または概してイントラ予測)で、または「インターモード」(Pモード、Bモード、または概してインター予測)で符号化される。
PモードおよびBモードの場合、エンコーダは最初に、Frefによって示される「参照フレーム」中で符号化されるものに類似した1つまたは複数のブロックを探索する。探索は、概して、符号化されるべきブロックからのある空間変位のみになるように制限される。最良の一致、または「予測」が識別されたとき、それは2次元(2D)動きベクトル(Δx,Δy)の形態で表され、Δxは水平変位であり、Δyは垂直変位である。動きベクトルは参照フレームとともに使用されて、次のように予測ブロックFpredを構成する。
Figure 2014534734
フレーム内のピクセルの位置は(x,y)によって示される。Iモードで符号化されたブロックの場合、予測ブロックは、同じフレーム内の前に符号化された隣接ブロックからの空間的予測を使用して形成される。
IモードとPモードまたはBモードの両方の場合、予測誤差、すなわち、符号化されているブロック中および予測ブロック中のピクセル値間の差分は、離散コサイン変換(DCT)などの何らかの離散変換の重み付けされた基底関数のセットとして表される。変換は、4×4、8×8または16×16およびそれ以上などの様々なサイズのブロックに基づいて実行され得る。いくつかの状況では(たとえば、インターコーディングでは)、変換ブロックの形状は必ずしも正方形ではない。矩形形状の変換ブロックはまた、たとえば、16×4、32×8などの変換ブロックサイズで使用され得る。
重み(すなわち、変換係数)はその後量子化される。量子化は情報の損失をもたらし、したがって、量子化係数は、元の変換係数よりも低い精度を有する。
量子化された変換係数および動きベクトルは、「シンタックス要素」の例である。一部の制御情報に加えて、これらのシンタックス要素は、ビデオシーケンスのコード化表現を形成する。シンタックス要素はまた、エントロピーコード化され、それによって、その表現に必要なビット数をさらに低減し得る。エントロピーコーディングは、送信または記憶されたシンボル(我々のケースでは、シンタックス要素)を表すのに必要なビット数を、それらの分布の性質(いくつかのシンボルは他のシンボルよりも頻繁に生じる)を利用することによって最小限に抑えることを目的としたロスレス演算である。
デコーダでは、現在のフレーム中のブロックは、最初にエンコーダの場合と同様の方法でそれの予測を構成し、予測誤差を予測に追加することによって得られる。予測誤差は、量子化係数を使用して変換基底関数を重み付けすることによって発見される。再構成されたフレームと元のフレームとの間の差分は、再構成誤差と呼ばれる。
圧縮比、すなわち、元のシーケンスと圧縮されたシーケンスとを表すために使用されるビット数の比は、変換係数を量子化するときに使用される量子化パラメータ(QP)の値を調整することによって制御され得る。圧縮比はまた、採用されるエントロピーコーディングの方法に依存し得る。
新生のHEVC規格に従うビデオコーディングの場合、ビデオフレームはコーディングユニットに区分され得る。コーディングユニット(CU)は、概して、ビデオ圧縮のために様々なコーディングツールが適用される基本ユニットとして働く画像領域を指す。CUは通常、時としてYとして示されるルミナンス成分と、時としてUおよびVとして示される2つのクロマ成分とを有する。ビデオサンプリングフォーマットに応じて、U成分およびV成分のサイズは、サンプル数に関して、Y成分のサイズと同じであるか、またはY成分のサイズとは異なっていてもよい。CUは、一般に正方形であり、たとえば、ITU−T H.264などの他のビデオコーディング規格の下でのいわゆるマクロブロックと同様であると見なされ得る。本出願では、例示のために、開発中のHEVC規格の現在提案されている態様のいくつかに従うコーディングについて説明する。ただし、本開示で説明する技法は、H.264または他の規格に従って定義されるビデオコーディングプロセスあるいはプロプライエタリビデオコーディングプロセスなど、他のビデオコーディングプロセスのために有用であり得る。
HEVCの規格化の取り組みは、HEVCテストモデル(HM)と呼ばれるビデオコーディングデバイスのモデルに基づく。HMは、たとえば、ITU−T H.264/AVCによるデバイスに勝るビデオコーディングデバイスのいくつかの能力を仮定する。たとえば、H.264は9つのイントラ予測符号化モードを与えるが、HMは35個ものイントラ予測符号化モードを与える。
HEVCにおける35個のイントラ予測モードは、1つのDCモードと、1つの平面モードと、33個の異なる方向予測モードとを含む。方向予測モードを用いて、そのモードによって示されるある方向に沿った隣接ブロックの再構成されたピクセルに基づいて予測が実行される。異なる予測モードに関連する方向を図2に示す。
HMによれば、CUは、1つまたは複数の予測ユニット(PU)および/または1つまたは複数の変換ユニット(TU)を含み得る。ビットストリーム内のシンタックスデータは、ピクセルの数に関して最大CUである最大コーディングユニット(LCU)を定義し得る。概して、CUは、CUがサイズの差異を有しないことを除いて、H.264のマクロブロックと同様の目的を有する。したがって、CUはサブCUに分割され得る。概して、本開示におけるCUへの言及は、ピクチャの最大コーディングユニットまたはLCUのサブCUを指すことがある。LCUはサブCUに分割され得、各サブCUはさらにサブCUに分割され得る。ビットストリームのシンタックスデータは、CU深さと呼ばれる、LCUが分割され得る最大回数を定義し得る。それに応じて、ビットストリームは最小コーディングユニット(SCU)も定義し得る。本開示ではまた、CU、PU、またはTUのいずれかを指すために「ブロック」、「区分」または「部分」という用語を使用する。概して、「部分」は、ビデオフレームの任意のサブセットを指し得る。
LCUは4分木データ構造(quadtree data structure)に関連付けられ得る。概して、4分木データ構造はCUごとに1つのノードを含み、ルートノードはLCUに対応する。CUが4つのサブCUに分割される場合、CUに対応するノードは4つのリーフノードを含み、リーフノードの各々はサブCUのうちの1つに対応する。4分木データ構造の各ノードは、対応するCUのシンタックスデータを与え得る。たとえば、4分木のノードは、そのノードに対応するCUがサブCUに分割されるかどうかを示す分割フラグを含み得る。CUのシンタックス要素は、再帰的に定義されてよく、CUがサブCUに分割されるかどうかに依存し得る。CUがさらに分割されない場合、そのCUはリーフCUと呼ばれる。本開示では、元のリーフCUの明示的分割が存在しなくても、リーフCUの4つのサブCUをリーフCUとも呼ぶ。たとえば、16×16サイズのCUがさらに分割されない場合、この16×16CUが決して分割されなくても、4つの8×8サブCUをリーフCUとも呼ぶ。
リーフCUは、1つまたは複数の予測ユニット(PU)を含み得る。概して、PUは、対応するCUの全部または一部分を表し、そのPUの参照サンプルを取り出すためのデータを含み得る。たとえば、PUがインターモード符号化されるとき、PUは、PUの動きベクトルを定義するデータを含み得る。動きベクトルを定義するデータは、たとえば、動きベクトルの水平成分、動きベクトルの垂直成分、動きベクトルの解像度(たとえば、1/4ピクセル精度もしくは1/8ピクセル精度)、動きベクトルがポイントする参照フレーム、および/または動きベクトルの参照リスト(たとえば、リスト0もしくはリスト1)を記述し得る。(1つまたは複数の)PUを定義するリーフCUのデータはまた、たとえば、CUを1つまたは複数のPUに区分することを記述し得る。区分モードは、CUがコーディングされないか、イントラ予測モード符号化されるか、またはインター予測モード符号化されるかに応じて異なり得る。イントラコーディングの場合、PUは、以下で説明するリーフ変換ユニットと同じように扱われ得る。
新生のHEVC規格は、CUごとに異なり得る変換ユニット(TU)に従う変換を可能にする。TUは、一般に、区分されたLCUについて定義された所与のCU内のPUのサイズに基づいてサイズ決定されるが、常にそうであるとは限らない。TUは、一般にPUと同じサイズであるかまたはPUよりも小さい。いくつかの例では、CUに対応する残差サンプルは、「残差4分木」(RQT:residual quad tree)として知られる4分木構造を使用してより小さいユニットに再分割され得る。RQTのリーフノードは変換ユニット(TU)と呼ばれることがある。TUに関連するピクセル差分値は、量子化され得る変換係数を生成するために変換され得る。
概して、PUは、予測プロセスに関係するデータを指す。たとえば、PUがイントラモード符号化されるとき、PUは、PUのイントラ予測モードを記述するデータを含み得る。別の例として、PUがインターモード符号化されるとき、PUは、PUの動きベクトルを定義するデータを含み得る。
概して、TUは、変換プロセスと量子化プロセスとのために使用される。1つまたは複数のPUを有する所与のCUは、1つまたは複数の変換ユニット(TU)も含み得る。予測に続いて、ビデオエンコーダ20は、PUに従ってコーディングノードによって識別されたビデオブロックから残差値を計算し得る。コーディングノードは、次いで、元のビデオブロックではなく残差値を参照するように更新される。残差値はピクセル差分値を備え、ピクセル差分値は、エントロピーコーディングのためのシリアル化変換係数(serialized transform coefficient)を生成するためにTU中で指定された変換と他の変換情報とを使用して変換係数に変換され、量子化され、走査され得る。コーディングノードはこれらのシリアル化変換係数を指すようにもう一度更新され得る。本開示は、一般に、CUのコーディングノードを指す「ビデオブロック」という用語を使用する。いくつかの特定の場合において、本開示は、コーディングノードならびにPUおよびTUを含む、ツリーブロック、すなわち、LCUまたはCUを指す「ビデオブロック」という用語も使用し得る。
ビデオシーケンスは、一般に、一連のビデオフレームまたはピクチャを含む。ピクチャグループ(GOP)は、概して、ビデオピクチャのうちの一連の1つまたは複数を備える。GOPは、GOP中に含まれるいくつかのピクチャを記述するシンタックスデータを、GOPのヘッダ中、ピクチャのうちの1つまたは複数のヘッダ中、または他の場所に含み得る。ピクチャの各スライスは、それぞれのスライスの符号化モードを記述するスライスシンタックスデータを含み得る。ビデオエンコーダ20は、一般に、ビデオデータを符号化するために個々のビデオスライス内のビデオブロックに対して動作する。ビデオブロックはCU内のコーディングノードに対応し得る。ビデオブロックは、サイズを固定することも変更することもでき、指定のコーディング規格に応じてサイズが異なることがある。
図3に示すように、サイズ2N×2Nのイントラ予測されたCUの場合、HEVCの1つの提案において指定された2つのPU区分タイプ、すなわち、2N×2N PU区分19とN×N PU区分21とがある。HEVCの1つの提案では、N×Nは最小のCUレベルでのみ許容される。しかしながら、本開示の技法は任意のサイズのN×N PU区分に適用され得る。2N×2N PU区分は、CUと同じサイズであるPUをもたらす。N×N PU区分の場合、CUは4つのN×N PUを有し、N×N PUの各々は関連するCUのサイズの4分の1である。4つのPUの各々はそれ独自のイントラ予測モード方向を有し得る。
HEVCは4分木変換ユニット区分構造を可能にする。図4に示すように、たとえば、外側ブロック23はCUまたはLCU23である。HEVCの1つの提案では、LCUは64×64もの大きさであってもよいが、本開示の技法は任意のサイズのCUまたはLCUに適用可能である。外側ブロック23の内部ブロックは4分木構造による変換ブロック(たとえば、TU)分解の結果を表す。もちろん、そのような結果は多くの可能な分解のうちの1つにすぎない。分解は、コーディングユニットのあるエリアに適用される変換のサイズを示す。実際、分解はCU内のTUのサイズを示す。
図4の例では、3つのレベルの変換ブロック分解がある。レベル1分解により、ブロック全体が4つの4分の1サイズの変換ブロック、25A、25B、25Cおよび25Dに分割される。次いで、レベル2分解では、レベル1の4分の1サイズの変換ブロック25Dは、4つの16の1サイズの変換ブロック、27A、27B、27Cおよび27Dにさらに分割される。次いで、レベル3分解では、変換ブロック27Dは4つのより一層小さい(64分の1サイズの)変換ブロックにさらに分割される。レベル0における変換ブロックは、CU全体がさらなる分割なしに一緒に変換されることを意味する。この場合、TUは同じサイズのCUを有する。実際には、TUがさらに分割されるかどうかはレートひずみ最適化に基づいて決定される。
2N×2N PUの場合、HEVCの1つの提案によれば、正方形のTUのみが許容される。加えて、イントラ予測されるブロックに対して、TUは常にPUと整合される。すなわち、イントラ予測されるブロック中のTUは、そのブロック中のPUと同じサイズおよび形状を有する。正方形TUの例を図5に示す。ブロック29は4つの4分の1サイズのPU/TUに区分される。ブロック31では、右上の4分の1サイズのPU/TUは、元のブロックサイズの16分の1のサイズを有する4つのより小さいPU/TUにさらに区分される。HEVCの提案に基づいて、ブロック29および31の各々が別々に予測され、変換され、再構成される。変換ブロック(すなわち、TU)サイズは予測ブロック(すなわち、PU)サイズと同じである。
より最近では、2N×2N PU/TU(すなわち、4分木分解のレベル0)とともに使用する非正方形変換の使用が提案されている。非正方形変換のいくつかの例を図6に示す。ブロック33は垂直方向に配向した変換区分を示し、ブロック35は水平方向に配向した変換区分を示す。ブロック33の区分は時としてhN×2N区分と呼ばれる。この文脈では、hは「半分(half)」を指す。したがって、hN×2N区分の幅(すなわち、hN)はその区分の高さ(すなわち、2N)の4分の1の長さである。同様に、ブロック35の区分は時として2N×hN区分と呼ばれる。したがって、2N×hN区分の高さ(すなわち、hN)はその区分の幅(すなわち、2N)の4分の1の長さである。各場合において、TU区分は矩形形状を有する。非正方形変換は短距離イントラ予測(SDIP:short distance intra-prediction)と呼ばれる技法で使用され得る。SDIPは、(図6に示すTU区分に類似した)非正方形PU区分を利用して、イントラ予測技法を適用する。
本開示で提案されるように、非正方形変換の使用は、レベル1を含む、4分木構造の他のレベルに拡張される。したがって、ビデオエンコーダ(たとえば、ビデオエンコーダ20)はレベル1のN×N変換区分(すなわち、正方形変換)と非正方形レベル1のSDIP変換区分とから選択し得る。やはり、非正方形変換区分はhN×2N(たとえば、図6のブロック33)区分と2N×hN(たとえば、図6のブロック35)区分とを含み得る。本開示全体にわたって、変換区分および変換ユニットという用語は互換的に使用される。具体的には、変換区分という用語は、得られる変換ユニットと、コーディングユニットまたは予測ユニットの変換ユニットへの分割の両方に適用され得る。加えて、ブロックまたはサブブロック(sub-block)という用語は、コーディングユニット、予測ユニット、変換区分、または変換ユニットのいずれかを指すために使用され得る。具体的には、サブブロックという用語は、変換区分がさらにサブ分割されたときに得られる変換ユニットを指すために使用され得る。
変換区分の選択をシグナリングするために使用されるシンタックスは次の通りである。
NS_Flag:このフラグはN×N変換区分が選択されるかどうかを示す。たとえば、NS_Flag=0の場合、N×N変換が選択されることを意味し、NS_Flag=1の場合、非正方形(たとえば、hN×2Nまたは2N×hN)変換が選択されることを意味する。
NS_direction_Flag:このフラグはどの非正方形変換が選択されているかを指す。たとえば、NS_direction_Flag=0の場合、垂直方向に配向された変換(hN×2N)が選択されることを意味し、NS_direction_Flag=1の場合、水平方向に配向された変換(2N×hN)が選択されることを意味する。
上記で説明したように、非正方形変換区分は2N×2N CUの4分木構造のレベル1で適用され得る。本開示では、非正方形変換区分をN×N PU/TU区分に適用するためのおよび/または非正方形変換区分の使用を4分木構造の他のレベルに拡張するための方法および技法についてさらに説明する。
本開示の一例では、NS_FlagおよびNS_direction_flagはCUレベルでシグナリング(signaling)される。これは、N×N PU区分の場合、CU中のすべての4つのPUがNS_FlagおよびNS_direction_flagの同じ値を共有することを意味する。したがって、PUの各々に対するTUは同じである。例を図7に示す。CU37は4つのN×N PUに分割される。CUレベルでは、NS_Flag=1およびNS_direction_Flag=1である。この場合、CU37のすべての4つのN×N PUは同じ非正方形変換(すなわち、水平方向に配向された2N×hN変換区分)を有する。CU39も4つのN×N PUに分割される。CUレベルでは、CU39の場合、NS_Flag=1およびNS_direction_Flag=0である。この場合、CU39のすべての4つのN×N PUは同じ非正方形変換(すなわち、垂直方向に配向されたhN×2N変換区分)を有する。
図7の例では、CU内のPUのサイズおよび形状はTUのサイズおよび形状と異なっていてもよい。他の例では、PUはまた、SDIPに使用される非正方形PU区分などの非正方形形状を有し得る。
本開示の別の例では、NS_FlagおよびNS_direction_flagはN×N PU区分ごとに別々にシグナリングされる。これは、各PUがそれ独自のNS_FlagとNS_direction_flagとに関連付けられることを意味する。したがって、各PUは異なる変換区分を有し得る。一例を図8に示す。CU41は4つのN×N PU(左上がPU0であり、右上がPU1であり、左下がPU2であり、右下がPU3である)に分割される。この例では、PU0の場合、NS_Flag=1であり、NS_direction_flag=0である。したがって、垂直方向に配向されたhN×2N非正方形変換区分が使用される。PU1の場合、NS_Flag=0である。したがって、正方形変換区分が使用される。PU2の場合、NS_Flag=1であり、NS_direction_flag=1である。したがって、水平方向に配向された2N×hN非正方形変換区分が使用される。同様に、PU3の場合、NS_Flag=1であり、NS_direction_flag=1である。したがって、水平方向に配向された2N×hN非正方形変換区分が使用される。
本開示の別の例では、さらに非正方形変換を4分木構造のレベル1に適用するために、図7および図8に示すように、非正方形変換が4分木構造分解の他のレベル(たとえば、レベル2、レベル3など)で適用される。一例として、4つのN×N PUを有するCUの場合を考える。図9に示すように、第1のN×N PU(たとえば、NS_Flag=1、NS_direction_flag=0を有する図8のPU0)は最初に、4つの垂直方向に配向された、サイズ(1/4N)×Nの非正方形変換サブブロック43A、43B、43Cおよび43Dに分割され得る。各サブブロックについて、サブブロックがさらに分割されるかどうかを示すために(1つまたは複数の)追加のフラグがシグナリングされ得る。たとえば、このフラグが1である場合、(1/4N)×Nブロックがさらに分割される。
1つの具体的な例では、図9に示すように、垂直方向に配向されたサブブロック43Aは4つの(1/16N)×N変換区分にさらに分割され得る。他の例では、サブブロック43Aは4つの(1/4N)×(1/4N)変換区分に分割されるか、または4つの(1/8N)×(1/2N)変換区分に分割され得る。図10は、4つの(1/4N)×(1/4N)変換区分にさらに分割される、垂直方向に配向されたTU区分の一例を示す。図11は、4つの(1/8N)×(1/2N)変換区分にさらに分割される、垂直方向に配向されたTU区分の一例を示す。
さらなる区分を示すために、追加のビットが区分(たとえば、PU0)レベルでシグナリングされる。一例として、NS_flag_PUXおよびNS_direction_flag_PUXが使用され得る。NS_flag_PUX=0の場合、これは4つの(1/8N)×(1/2N)変換区分への分割を示す。NS_flag_PUX=1の場合、NS_direction_flag_PUXがさらにシグナリングされる。NS_direction_flag_PUX=0は4つの(1/16N)×N変換区分への分割を示す。NS_direction_flag_PUX=1は4つの(1/4N)×(1/4N)変換区分への分割を示す。
上記の例では、さらなる分割のための3つの可能な変換区分があり、したがって、オーバーヘッドビットが使用され得る(すなわち、2つのフラグが必要となる)。複数のフラグの使用を回避するために、本開示は、レベル1分解を超えたさらなる分割の場合に1つの変換区分タイプが許容される例示的な技法を提案する。たとえば、hN×2N変換区分のさらなる分割は、4つの(1/8N)×2N変換区分を生成することのみに限定される。別の例として、2N×hN変換区分のさらなる分割は、4つの2N×(1/8N)変換区分を生成することのみに限定される。別の例として、N×N変換区分のさらなる分割は、4つの1/4N×1/4N変換区分を生成することのみに限定される。区分および分割の他の組合せが使用され得ることを理解されたい。
イントラ予測されるブロックの非正方形変換の例示的な一実装形態では、非正方形変換を適用するかどうかはCUのサイズに依存する。サイズ2N×2Nを有するCUについて最小の許容された/利用可能な非正方形変換サイズがh×2Nおよび2N×hNである例を考える。ビデオエンコーダ(たとえば、ビデオエンコーダ20)はNS_FlagとNS_direction_Flagとをシグナリングして、非正方形変換区分の選択を指定するように構成され得る。場合によっては、これはビットを浪費し得る。たとえば、ビデオエンコーダが4分木構造のレベル1におけるコーディングブロックである(変換ブロックはサイズN×Nである)と仮定する。したがって、h×2Nまたは2N×hN変換区分はいずれもそのレベルにおけるブロックサイズに収まることができない。しかしながら、例示的な実装形態における決定はCUサイズに基づき、CUサイズ2N×2Nは(1/2N)×2Nおよび2N×(1/2N)よりも大きいので、エンコーダは依然としてNS_FlagとNS_direction_Flagとをシグナリングし、したがってビットを浪費し得る。
この潜在的な欠点を改善するために、本開示はNS_FlagとNS_direction_Flagとをシグナリングするという決定が変換ブロックサイズに基づくことをさらに提案する。たとえば、変換ブロックサイズをM×Mとし、最小の非正方形変換サイズをA×BおよびB×Aとする。M<max(A,B)の場合、非正方形変換区分をこの変換ブロックに適用することができず、したがって、エンコーダはNS_FlagとNS_direction_Flagとをシグナリングしない。そうでない場合、これらのシンタックス要素がシグナリングされる。
図12は、本開示で説明するイントラ予測コーディングのための技法を使用し得るビデオエンコーダ20の一例を示すブロック図である。ビデオエンコーダ20について、例示のためにHEVCコーディングのコンテキストにおいて説明するが、変換係数の走査を必要とし得る他のコーディング規格または方法に関して本開示を限定するものではない。ビデオエンコーダ20は、ビデオフレーム内のPUのイントラコーディングおよびインターコーディングを実行し得る。イントラコーディングは、所与のビデオフレーム内のビデオデータの空間的冗長性を低減または除去するために空間的予測に依拠する。インターコーディングは、ビデオシーケンスの現在のフレームと前にコーディングされたフレームとの間の時間的冗長性を低減または除去するために時間的予測に依拠する。イントラモード(Iモード)は、いくつかの空間ベースのビデオ圧縮モードのいずれかを指し得る。単方向予測(Pモード)または双方向予測(Bモード)などのインターモードは、いくつかの時間ベースのビデオ圧縮モードのいずれかを指し得る。
図12に示すように、ビデオエンコーダ20は、符号化されるべきビデオフレーム内の現在のビデオブロックを受信する。図12の例では、ビデオエンコーダ20は、動き補償ユニット44と、動き推定ユニット42と、イントラ予測ユニット46と、参照フレームバッファ64と、加算器50と、変換ユニット52と、量子化ユニット54と、エントロピー符号化ユニット56とを含む。ビデオブロック再構成のために、ビデオエンコーダ20はまた、逆量子化ユニット58と、逆変換ユニット60と、加算器62とを含む。再構成されたビデオからブロッキネスアーティファクトを除去するためにブロック境界をフィルタ処理するデブロッキングフィルタ(図12に図示せず)も含まれ得る。所望される場合、デブロッキングフィルタは、一般に、加算器62の出力をフィルタ処理するであろう。
符号化プロセス中に、ビデオエンコーダ20は、コーディングされるべきビデオフレームまたはスライスを受信する。フレームまたはスライスは、複数のビデオブロック、たとえば、最大コーディングユニット(LCU)に分割され得る。動き推定ユニット42および動き補償ユニット44は、時間圧縮を行うために、1つまたは複数の参照フレーム中の1つまたは複数のブロックに対して受信したビデオブロックのインター予測コーディングを実行する。イントラ予測ユニット46は、空間圧縮を行うために、コーディングされるべきブロックと同じフレームまたはスライス中の1つまたは複数の隣接ブロックに対して受信したビデオブロックのイントラ予測コーディングを実行し得る。
モード選択ユニット40は、たとえば、各モードについてのレートひずみ分析に基づいて、コーディングモードのうちの1つ、すなわち、イントラまたはインターを選択し得、得られたイントラまたはインター予測ブロック(たとえば、予測ユニット(PU))を、残差ブロックデータを生成するために加算器50に与え、参照フレーム中で使用する符号化ブロックを再構成するために加算器62に与える。加算器62は、以下でより詳細に説明するように、予測ブロックを、そのブロックについての、逆変換ユニット60からの逆量子化され逆変換されたデータと合成して、符号化ブロックを再構成する。いくつかのビデオフレームがIフレームとして指定されることがあり、Iフレーム中のすべてのブロックはイントラ予測モードで符号化される。場合によっては、たとえば、動き推定ユニット42によって実行された動き探索によって得られたブロックの予測が不十分であったとき、イントラ予測ユニット46は、PフレームまたはBフレーム中のブロックのイントラ予測符号化を実行し得る。
動き推定ユニット42および動き補償ユニット44は、高度に統合され得るが、概念的な目的のために別々に示されている。動き推定(または動き探索)は、ビデオブロックの動きを推定する動きベクトルを生成するプロセスである。動きベクトルは、たとえば、参照フレームの参照サンプルに対する、現在のフレーム中の予測ユニットの変位を示し得る。動き推定ユニット42は、予測ユニットを参照フレームバッファ64に記憶された参照フレームの参照サンプルと比較することによって、インターコード化フレームの予測ユニットの動きベクトルを計算する。参照サンプルは、絶対値差分和(SAD:sum of absolute difference)、2乗差分和(SSD:sum of squared difference)、または他の差分メトリックによって求められ得るピクセル差分に関して、コーディングされているPUを含むCUの部分とぴったり一致することがわかるブロックであり得る。参照サンプルは、参照フレームまたは参照スライス内のどこにでも発生する可能性があり、必ずしも、参照フレームまたはスライスのブロック(たとえば、コーディングユニット)境界において発生するとは限らない。いくつかの例では、参照サンプルは分数ピクセル位置において発生し得る。
動き推定ユニット42は、計算された動きベクトルをエントロピー符号化ユニット56と動き補償ユニット44とに送る。動きベクトルによって識別される参照フレームの部分は参照サンプルと呼ばれることがある。動き補償ユニット44は、たとえば、PUの動きベクトルによって識別される参照サンプルを取り出すことによって、現在のCUの予測ユニットについての予測値を計算し得る。
イントラ予測ユニット46は、動き推定ユニット42および動き補償ユニット44によって実行されるインター予測の代替として、受信したブロックに対してイントラ予測を実行し得る。イントラ予測ユニット46は、隣接する、前にコーディングされたブロック、たとえば、ブロックについての左から右へ、上から下への符号化順序を仮定すると、現在のブロックの上、右上、左上、または左のブロックに対して、受信したブロックを予測し得る。イントラ予測ユニット46は、様々なイントラ予測モードで構成され得る。たとえば、イントラ予測ユニット46は、符号化されているCUのサイズに基づいて、一定数の方向予測モード、たとえば、35個の方向予測モードで構成され得る。
イントラ予測ユニット46は、たとえば、様々なイントラ予測モードの誤差値を計算し、最も低い誤差値を生じるモードを選択することによって、イントラ予測モードを選択し得る。方向予測モードは、空間的に隣接するピクセルの値を合成し、その合成された値をPU中の1つまたは複数のピクセル位置に適用するための機能を含み得る。PU中のすべてのピクセル位置の値が計算されると、イントラ予測ユニット46は、PUと符号化されるべき受信したブロックとの間のピクセルの差分に基づいて、予測モードの誤差値を計算し得る。イントラ予測ユニット46は、許容できる誤差値を生じるイントラ予測モードが発見されるまでイントラ予測モードをテストし続け得る。イントラ予測ユニット46は、次いで、PUを加算器50に送り得る。
ビデオエンコーダ20は、コーディングされている元のビデオブロックから、動き補償ユニット44またはイントラ予測ユニット46によって計算された予測データを減算することによって残差ブロックを形成する。加算器50は、この減算演算を実行する1つまたは複数の構成要素を表す。残差ブロックはピクセル差分値の2次元行列に対応してよく、残差ブロック中の値の数は、残差ブロックに対応するPU中のピクセルの数と同じである。残差ブロック中の値は、PU中のコロケートピクセルの値と、コーディングされるべき元のブロック中のコロケートピクセルの値との間の差分、すなわち、誤差に対応し得る。差分は、コーディングされるブロックのタイプに応じてクロマ差分またはルーマ差分であり得る。
変換ユニット52は、残差ブロックから1つまたは複数の変換ユニット(TU)を形成し得る。変換ユニット52は、複数の変換の中から変換を選択する。変換は、ブロックサイズ、コーディングモードなど、1つまたは複数のコーディング特性に基づいて選択され得る。変換ユニット52は、次いで、選択された変換をTUに適用して、変換係数の2次元アレイを備えるビデオブロックを生成する。変換ユニット52は、本開示の上記で説明した技法に従って、イントラコード化ブロックの変換区分を選択し得る。変換ユニット52、またはビデオエンコーダ20の別のユニットは、選択された変換区分タイプおよび/または符号化ビデオビットストリーム中の方向をシグナリングし得る。
変換ユニット52は、得られた変換係数を量子化ユニット54に送り得る。量子化ユニット54は、次いで、その変換係数を量子化し得る。エントロピー符号化ユニット56は、次いで、走査モードに従って、行列中の量子化された変換係数の走査を実行し得る。本開示は、エントロピー符号化ユニット56が走査を実行するものとして説明する。ただし、他の例では、量子化ユニット54などの他の処理ユニットが走査を実行することができることを理解されたい。
変換係数が1次元アレイに走査されると、エントロピー符号化ユニット56は、CAVLC、CABAC、PIPE、シンタックスベースコンテキスト適応型バイナリ算術コーディング(SBAC:syntax-based context-adaptive binary arithmetic coding)、または別のエントロピーコーディング方法などのエントロピーコーディングを係数に適用し得る。
CAVLCを実行するために、エントロピー符号化ユニット56は、送信されるべきシンボルの可変長コードを選択し得る。VLCのコードワードは、相対的により短いコードがより可能性が高いシンボルに対応し、より長いコードがより可能性が低いシンボルに対応するように構築され得る。このようにして、VLCの使用は、たとえば、送信されるべき各シンボルのために等長コードワードを使用するよりも、ビット節約を達成し得る。
CABACを実行するために、エントロピー符号化ユニット56は、送信されるべきシンボルを符号化するために、あるコンテキストに適用すべきコンテキストモデルを選択し得る。コンテキストは、たとえば、隣接値が非ゼロか否かに関係し得る。エントロピー符号化ユニット56はまた、選択された変換を表す信号などのシンタックス要素をエントロピー符号化し得る。本開示の技法によれば、エントロピー符号化ユニット56は、コンテキストモデル選択に使用される要因の中でも、たとえば、イントラ予測モードのためのイントラ予測方向、シンタックス要素に対応する係数の走査位置、ブロックタイプ、および/または変換タイプに基づいて、これらのシンタックス要素を符号化するために使用されるコンテキストモデルを選択し得る。
エントロピー符号化ユニット56によるエントロピーコーディングの後に、得られた符号化ビデオは、ビデオデコーダ30などの別のデバイスに送信されてよく、または、後で送信するかまたは取り出すためにアーカイブされてよい。場合によっては、エントロピー符号化ユニット56またはビデオエンコーダ20の別のユニットは、エントロピーコーディングに加えて他のコーディング機能を実行するように構成され得る。たとえば、エントロピー符号化ユニット56は、CUおよびPUのコード化ブロックパターン(CBP)値を決定するように構成され得る。また、場合によっては、エントロピー符号化ユニット56は、係数のランレングスコーディングを実行し得る。
逆量子化ユニット58および逆変換ユニット60は、それぞれ逆量子化(inverse quantization)および逆変換(inverse transformation)を適用して、たとえば参照ブロックとして後で使用するために、ピクセル領域中で残差ブロックを再構成する。動き補償ユニット44は、残差ブロックを参照フレームバッファ64のフレームのうちの1つの予測ブロックに加算することによって参照ブロックを計算し得る。動き補償ユニット44はまた、再構成された残差ブロックに1つまたは複数の補間フィルタを適用して、動き推定において使用するサブ整数ピクセル値を計算し得る。加算器62は、再構成された残差ブロックを、動き補償ユニット44によって生成された動き補償予測ブロックに加算して、参照フレームバッファ64に記憶するための再構成されたビデオブロックを生成する。再構成されたビデオブロックは、後続のビデオフレーム中のブロックをインターコーディングするために動き推定ユニット42および動き補償ユニット44によって参照ブロックとして使用され得る。
図13は、符号化ビデオシーケンスを復号するビデオデコーダ30の一例を示すブロック図である。図13の例では、ビデオデコーダ30は、エントロピー復号ユニット70と、動き補償ユニット72と、イントラ予測ユニット74と、逆量子化ユニット76と、逆変換ユニット78と、参照フレームバッファ82と、加算器80とを含む。ビデオデコーダ30は、いくつかの例では、ビデオエンコーダ20(図12参照)に関して説明した符号化パスとは概して逆の復号パスを実行し得る。
エントロピー復号ユニット70は、変換係数の1次元アレイを取り出すために、符号化ビットストリームに対してエントロピー復号プロセスを実行する。使用されるエントロピー復号プロセスは、ビデオエンコーダ20によって使用されたエントロピーコーディング(たとえば、CABAC、CAVLCなど)に依存する。エンコーダによって使用されたエントロピーコーディングプロセスは、符号化ビットストリーム中でシグナリングされ得るか、または所定のプロセスであり得る。
いくつかの例では、エントロピー復号ユニット70(または逆量子化ユニット76)は、ビデオエンコーダ20のエントロピー符号化ユニット56(または量子化ユニット54)によって使用された走査モードをミラーリングする走査を使用して、受信した値を走査し得る。係数の走査は逆量子化ユニット76において実行され得るが、走査は、例示のために、エントロピー復号ユニット70によって実行されるものとして説明される。さらに、説明しやすいように別個の機能ユニットとして示されているが、ビデオデコーダ30のエントロピー復号ユニット70、逆量子化ユニット76、および他のユニットの構造および機能は互いに高度に統合され得る。
逆量子化ユニット76は、ビットストリーム中で与えられ、エントロピー復号ユニット70によって復号された、量子化された変換係数を逆量子化(inverse quantize)、すなわち、逆量子化(de-quantize)する。逆量子化プロセスは、たとえば、HEVCのために提案されたプロセスまたはH.264復号規格によって定義されたプロセスと同様の、従来のプロセスを含み得る。逆量子化プロセスは、量子化の程度を判断し、同様に、適用されるべき逆量子化の程度を判断するための、CUについてビデオエンコーダ20によって計算される量子化パラメータQPの使用を含み得る。逆量子化ユニット76は、係数が1次元アレイから2次元アレイに変換される前または変換された後に変換係数を逆量子化し得る。
逆変換ユニット78は、逆量子化された変換係数に逆変換を適用する。いくつかの例では、逆変換ユニット78は、ビデオエンコーダ20からのシグナリングに基づいて、またはブロックサイズ、コーディングモードなどの1つまたは複数のコーディング特性から変換を推論することによって、逆変換を判断し得る。いくつかの例では、逆変換ユニット78は、本開示の上記で説明した技法に従って、符号化ビデオビットストリームで受信されたシグナリングされた変換区分タイプに基づいて、現在のブロックに適用すべき変換を判断し得る。具体的には、正方形または非正方形区分タイプの使用を示すシンタックス要素、ならびに非正方形区分の区分方向を示すシンタックス要素は、イントラ予測されるブロックについて受信され得る。いくつかの例では、逆変換ユニット78は、逆変換ユニット78が、復号されている現在のブロックの変換係数に2つ以上の逆変換を適用する、カスケード逆変換を適用し得る。
イントラ予測ユニット74は、シグナリングされたイントラ予測モードと、現在のフレームの前に復号されたブロックからのデータとに基づいて現在のフレームの現在のブロックについての予測データを生成し得る。
取り出された動き予測方向、参照フレームインデックス、および計算された現在の動きベクトルに基づいて、動き補償ユニットは現在の部分の動き補償ブロックを生成する。これらの動き補償ブロックは、本質的に、残差データを生成するために使用される予測ブロックを再現する。
動き補償ユニット72は、動き補償ブロックを生成し、場合によっては、補間フィルタに基づいて補間を実行し得る。サブピクセル精度をもつ動き推定に使用されるべき補間フィルタの識別子は、シンタックス要素中に含まれ得る。動き補償ユニット72は、ビデオブロックの符号化中にビデオエンコーダ20によって使用される補間フィルタを使用して、参照ブロックのサブ整数ピクセルの補間値を計算し得る。動き補償ユニット72は、受信したシンタックス情報に従って、ビデオエンコーダ20によって使用された補間フィルタを判断し、その補間フィルタを使用して予測ブロックを生成し得る。
さらに、動き補償ユニット72およびイントラ予測ユニット74は、HEVCの例では、(たとえば、4分木によって与えられる)シンタックス情報の一部を使用して、符号化ビデオシーケンスの(1つまたは複数の)フレームを符号化するために使用されるLCUのサイズを判断し得る。動き補償ユニット72およびイントラ予測ユニット74はまた、シンタックス情報を使用して、符号化ビデオシーケンスのフレームの各CUがどのように分割されるか(および、同様に、サブCUがどのように分割されるか)を記述する分割情報を決定し得る。シンタックス情報はまた、各分割がどのように符号化されるかを示すモード(たとえば、イントラまたはインター予測、およびイントラ予測の場合はイントラ予測符号化モード)と、各インター符号化PUについての1つまたは複数の参照フレーム(および/またはそれらの参照フレームの識別子を含んでいる参照リスト)と、符号化ビデオシーケンスを復号するための他の情報とを含み得る。
加算器80は、残差ブロックを、動き補償ユニット72またはイントラ予測ユニット74によって生成される対応する予測ブロックと合成して、復号ブロックを形成する。所望される場合、ブロッキネスアーティファクトを除去するために、デブロッキングフィルタを適用して復号ブロックをフィルタ処理することもある。復号ビデオブロックは、次いで、参照フレームバッファ82に記憶され、参照フレームバッファ82は、参照ブロックを後続の動き補償に与え、また、(図1のディスプレイデバイス32などの)ディスプレイデバイス上での提示のために復号ビデオを生成する。
図14は、本開示の技法による例示的なビデオ符号化方法を示すフローチャートである。図14の方法は、ビデオエンコーダ20の1つまたは複数の構成要素、ユニット、またはモジュールによって実行され得る。
ビデオエンコーダ20は、本開示の技法に従ってビデオ符号化方法を実行するように構成され得る。一例では、ビデオエンコーダ20は、コーディングユニットを複数の予測ユニットに区分することであって、コーディングユニットがイントラ予測を使用して符号化されること(120)と、予測ユニットの変換区分を決定することであって、変換区分のうちの少なくとも1つが非正方形区分であること(122)とを行うように構成され得る。このようにして、非正方形変換が4分木構造のレベル0よりも高いレベル(たとえば、レベル1)で適用される。たとえば、予測ユニットは4分木構造のレベル1にあり得る。
本開示の他の例では、区分すること(120)および決定すること(122)は4分木構造のより高いレベルで実行され得る。たとえば、ビデオエンコーダ20は決定された変換区分に従って複数の予測ユニットのうちの1つまたは複数をサブブロックに区分し、サブブロックの各々のさらなる区分タイプを決定するようにさらに構成され得る。一例では、サブブロックは2またはそれ以上の4分木分解レベルにある。一例では、さらなる区分タイプは、複数の予測ユニットをサブブロックに区分するために使用される決定された変換区分に基づいて、決定される。別の例では、ビデオエンコーダ20は、さらなる区分タイプを1つの変換タイプと1つの変換方向とに限定するようにさらに構成され得る。別の例では、ビデオエンコーダ20は、サブブロックの区分サイズに基づいて、サブブロックのさらなる区分タイプを決定するように構成され得る。
ビデオエンコーダ20は、変換タイプを示す第1のシンタックス要素をシグナリングすることであって、変換タイプが正方形変換区分および非正方形変換区分のうちの少なくとも1つから選択されること(124)を行うようにさらに構成され得る。本開示の一例では、ビデオエンコーダ20は、複数の予測ユニットの各々が同じ変換区分を有するように、コーディングユニットの変換区分を決定するように構成され得る。この場合、第1のシンタックス要素はコーディングユニットレベルでシグナリングされる。本開示の別の例では、ビデオエンコーダ20は複数の予測ユニットの各々の変換区分を別々に決定するように構成され得る。この場合、第1のシンタックス要素は予測ユニットレベルでシグナリングされる。
ビデオエンコーダ20は、第1のシンタックス要素が非正方形変換タイプを示す場合、非正方形変換タイプを有する各変換区分の変換方向を示す第2のシンタックス要素をシグナリングすることであって、変換方向が水平方向に配向された方向および垂直方向に配向された方向のうちの少なくとも1つから選択されること(126)を行うようにさらに構成され得る。ビデオエンコーダ20は、変換を変換区分の各々に適用して、残差予測データ(residual prediction data)を符号化する(128)ようにさらに構成され得る。
図15は、本開示の技法による例示的なビデオ復号方法を示すフローチャートである。図15の方法は、ビデオエンコーダ30の1つまたは複数の構成要素、ユニット、またはモジュールによって実行され得る。ビデオデコーダ30による非正方形区分の使用は、ビデオエンコーダ(たとえば、ビデオエンコーダ20)によって実行されたビットストリームシグナリングに応答したものであってもよく、またはビデオエンコーダによって用いられるルールに一致する所定のルールに基づいてもよい。
ビデオエンコーダ30は、本開示の技法に従ってビデオ復号方法を実行するように構成され得る。一例では、ビデオデコーダ30は、変換タイプを示す第1のシンタックス要素を受信することであって、変換タイプが正方形変換区分および非正方形変換区分のうちの少なくとも1つから選択されること(220)と、第1のシンタックス要素が非正方形変換タイプを示す場合、非正方形変換タイプを有する各変換区分の変換方向を示す第2のシンタックス要素を受信することであって、変換方向が水平方向に配向した方向および垂直方向に配向した方向のうちの少なくとも1つから選択されること(222)とを行うように構成され得る。ビデオデコーダ30が非正方形区分の使用を、明示的なシグナリングによってではなく、暗黙的にまたは所定のルールによって決定するように構成される場合、受信するステップは任意選択であることに留意されたい。
暗黙的に(たとえば、ルールによって)または明示的に(たとえば、受信した第1および第2のシンタックス要素によって)にかかわらず、ビデオデコーダ30は、コーディングユニットを複数の予測ユニットに区分することであって、コーディングユニットがイントラ予測を使用して符号化されること(224)と、予測ユニットの変換区分を決定することであって、変換区分のうちの少なくとも1つが非正方形区分であること(226)とを行うようにさらに構成され得る。
本開示の一例では、第1および第2のシンタックス要素はコーディングユニットレベルで受信される。したがって、ビデオデコーダ30は、複数の予測ユニットの各々が同じ変換区分を有するように、コーディングユニットの変換区分を決定するように構成され得る。本開示の別の例では、第1および第2のシンタックス要素は予測ユニットレベルで受信される。したがって、ビデオデコーダ30は複数の予測ユニットの各々の変換区分を別々に決定するように構成され得る。このようにして、非正方形変換が4分木構造のレベル0よりも高いレベル(たとえば、レベル1)で適用される。たとえば、予測ユニットは4分木構造のレベル1にあり得る。
本開示の他の例では、区分すること(224)および決定すること(226)は4分木構造のより高いレベルで実行され得る。たとえば、ビデオデコーダ30は決定された変換区分に従って複数の予測ユニットのうちの1つまたは複数をサブブロックに区分し、サブブロックの各々のさらなる区分タイプを決定するようにさらに構成され得る。一例では、サブブロックは2またはそれ以上の4分木分解レベルにある。一例では、さらなる区分タイプは、複数の予測ユニットをサブブロックに区分するために使用される決定された変換区分に基づいて、決定される。別の例では、ビデオデコーダ30は、さらなる区分タイプを1つの変換タイプと1つの変換方向とに限定するようにさらに構成され得る。別の例では、ビデオデコーダ30は、サブブロックの区分サイズに基づいて、サブブロックのさらなる区分タイプを決定するように構成され得る。
ビデオデコーダ30は、逆変換を変換区分の各々に適用して、残差予測データを復号する(228)ようにさらに構成され得る。ビデオデコーダ30は、イントラ予測を使用して残差予測データを復号して、復号ビデオデータを生成する(230)ようにさらに構成され得る。
1つまたは複数の例では、説明した機能は、ハードウェア、ソフトウェア、ファームウェア、またはそれらの任意の組合せで実装され得る。ソフトウェアで実装される場合、機能は、1つまたは複数の命令またはコードとしてコンピュータ可読媒体上に記憶されるか、あるいはコンピュータ可読媒体を介して送信され、ハードウェアベースの処理ユニットによって実行され得る。コンピュータ可読媒体は、たとえば、通信プロトコルに従って、ある場所から別の場所へのコンピュータプログラムの転送を可能にする任意の媒体を含むデータ記憶媒体または通信媒体などの有形媒体に対応するコンピュータ可読記憶媒体を含み得る。このようにして、コンピュータ可読媒体は、概して、(1)非一時的である有形コンピュータ可読記憶媒体、あるいは(2)信号または搬送波などの通信媒体に対応し得る。データ記憶媒体は、本開示で説明した技法の実装のための命令、コードおよび/またはデータ構造を取り出すために1つまたは複数のコンピュータあるいは1つまたは複数のプロセッサによってアクセスされ得る任意の利用可能な媒体であり得る。コンピュータプログラム製品はコンピュータ可読媒体を含み得る。
限定ではなく例として、そのようなコンピュータ可読記憶媒体は、RAM、ROM、EEPROM、CD−ROMまたは他の光ディスクストレージ、磁気ディスクストレージ、または他の磁気ストレージデバイス、フラッシュメモリ、あるいは命令またはデータ構造の形態の所望のプログラムコードを記憶するために使用され得、コンピュータによってアクセスされ得る、任意の他の媒体を備えることができる。また、いかなる接続もコンピュータ可読媒体と適切に呼ばれる。たとえば、命令が、同軸ケーブル、光ファイバーケーブル、ツイストペア、デジタル加入者回線(DSL)、または赤外線、無線、およびマイクロ波などのワイヤレス技術を使用して、ウェブサイト、サーバ、または他のリモートソースから送信される場合、同軸ケーブル、光ファイバーケーブル、ツイストペア、DSL、または赤外線、無線、およびマイクロ波などのワイヤレス技術は、媒体の定義に含まれる。ただし、コンピュータ可読記憶媒体およびデータ記憶媒体は、接続、搬送波、信号、または他の一時媒体を含まないが、代わりに非一時的有形記憶媒体を対象とすることを理解されたい。本明細書で使用するディスク(disk)およびディスク(disc)は、コンパクトディスク(disc)(CD)、レーザディスク(disc)、光ディスク(disc)、デジタル多用途ディスク(disc)(DVD)、フロッピー(登録商標)ディスク(disk)およびブルーレイディスク(disc)を含み、ディスク(disk)は、通常、データを磁気的に再生し、ディスク(disc)は、データをレーザで光学的に再生する。上記の組合せもコンピュータ可読媒体の範囲内に含めるべきである。
命令は、1つまたは複数のデジタル信号プロセッサ(DSP)などの1つまたは複数のプロセッサ、汎用マイクロプロセッサ、特定用途向け集積回路(ASIC)、フィールドプログラマブル論理アレイ(FPGA)、あるいは他の等価な集積回路またはディスクリート論理回路によって実行され得る。したがって、本明細書で使用する「プロセッサ」という用語は、前述の構造、または本明細書で説明する技法の実装に好適な任意の他の構造のいずれかを指し得る。さらに、いくつかの態様では、本明細書で説明した機能は、符号化および復号のために構成された専用のハードウェアおよび/またはソフトウェアモジュール内に与えられ得、あるいは複合コーデックに組み込まれ得る。また、本技法は、1つまたは複数の回路または論理要素中に十分に実装され得る。
本開示の技法は、ワイヤレスハンドセット、集積回路(IC)、またはICのセット(たとえば、チップセット)を含む、多種多様なデバイスまたは装置において実装され得る。本開示では、開示する技法を実行するように構成されたデバイスの機能的態様を強調するために様々な構成要素、モジュール、またはユニットについて説明したが、それらの構成要素、モジュール、またはユニットを、必ずしも異なるハードウェアユニットによって実現する必要があるとは限らない。むしろ、上記で説明したように、様々なユニットが、好適なソフトウェアおよび/またはファームウェアとともに、上記で説明した1つまたは複数のプロセッサを含めて、コーデックハードウェアユニットにおいて組み合わせられるか、または相互動作ハードウェアユニットの集合によって与えられ得る。
様々な例について説明した。これらおよび他の例は以下の特許請求の範囲内に入る。
様々な例について説明した。これらおよび他の例は以下の特許請求の範囲内に入る。
以下に、本願出願の当初の特許請求の範囲に記載された発明を付記する。
[C1]
ビデオ符号化方法であって、当該方法は下記を具備する。
コーディングユニットを複数の予測ユニットに区分することと、ここにおいて、前記コーディングユニットはイントラ予測を使用して符号化され、
前記予測ユニットに関する変換区分を決定することと、ここにおいて、前記変換区分のうちの少なくとも1つが非正方形区分である。
[C2]
C1に記載のビデオ符号化方法であって、当該方法は下記を具備する。
前記予測ユニットが4分木構造のレベル1にあることC。
[C3]
C1に記載のビデオ符号化方法であって、当該方法は下記を具備する。
前記変換区分を決定することは、前記複数の予測ユニットの各々が同じ変換区分を有するように、前記コーディングユニットに関する前記変換区分を決定することC。
[C4]
C3に記載のビデオ符号化方法であって、当該方法は下記を具備する。
前記コーディングユニットに関する変換タイプを示す第1のシンタックス要素をシグナリングすることと、ここにおいて、前記変換タイプは正方形変換区分および非正方形変換区分のうちの少なくとも1つから選択され、
前記第1のシンタックス要素が前記非正方形変換タイプを示す場合、前記非正方形変換タイプを有する各変換区分に関する変換方向を示す第2のシンタックス要素をシグナリングすることと、ここにおいて、前記変換方向は水平方向に配向された方向および垂直方向に配向された方向のうちの少なくとも1つから選択されるC。
[C5]
C1に記載のビデオ符号化方法であって、当該方法は下記を具備する。
前記変換区分を決定することは、前記複数の予測ユニットのそれぞれについて前記変換区分を別々に決定することC。
[C6]
C5に記載のビデオ符号化方法であって、当該方法は下記を具備する。
前記複数の予測ユニットの各々の変換タイプを示す第1のシンタックス要素をシグナリングすることと、ここにおいて、前記変換タイプは正方形変換区分および非正方形変換区分のうちの少なくとも1つから選択され、
前記第1のシンタックス要素が前記非正方形変換タイプを示す場合、前記非正方形変換タイプを有するそれぞれの変換区分について変換方向を示す第2のシンタックス要素をシグナリングすることと、ここにおいて、前記変換方向は水平方向に配向された方向および垂直方向に配向された方向のうちの少なくとも1つから選択されるC。
[C7]
C1に記載のビデオ符号化方法であって、当該方法は下記を具備する。
前記複数の予測ユニットのうちの前記1つまたは複数を、前記決定された変換区分に従ってサブブロックに区分することと、
それぞれの前記サブブロックについてさらなる区分タイプを決定することと、
特定の予測ユニットが分離していることを示すため、第1のシンタックス要素をシグナリングすることであって、ここにおいて、前記第1のシンタックス要素が前記サブブロックレベルでシグナリングされることC。
[C8]
C7に記載のビデオ符号化方法であって、当該方法は下記を具備する。
前記サブブロックが2またはそれ以上の4分木分解レベルにあることC。
[C9]
C7に記載のビデオ符号化方法であって、当該方法は下記を具備する。
前記第1のシンタックス要素がシグナリングされる場合、前記決定されたさらなる区分タイプを示す少なくとも第2のシンタックス要素をシグナリングすることC。
[C10]
C7に記載のビデオ符号化方法であって、当該方法は下記を具備する。
前記さらなる区分タイプは、前記複数の予測ユニットをサブブロックに区分するために使用された前記決定された変換区分に基づいて決定されることC。
[C11]
C7に記載のビデオ符号化方法であって、当該方法は下記を具備する。
前記さらなる区分タイプを1つの変換タイプと1つの変換方向とに限定すること
C。
[C12]
C7に記載のビデオ符号化方法であって、当該方法は下記を具備する。
前記サブブロックの前記さらなる区分タイプは、前記サブブロックの区分サイズに基づいて決定されることC。
[C13]
C1に記載のビデオ符号化方法であって、当該方法は下記を具備する。
変換を前記変換区分の各々に適用して、残差予測データを符号化すること
C。
[C14]
ビデオ復号化方法であって、当該方法は下記を具備する。
コーディングユニットを複数の予測ユニットに区分することと、ここにおいて、前記コーディングユニットはイントラ予測を使用して符号化され、
前記予測ユニットに関する変換区分を決定すること、ここにおいて、前記変換区分のうちの少なくとも1つが非正方形区分である。
[C15]
C14に記載のビデオ符号化方法であって、当該方法は下記を具備する。
変換タイプを示す第1のシンタックス要素を受信することと、ここにおいて、前記変換タイプは正方形変換区分および非正方形変換区分のうちの少なくとも1つから選択され、
前記第1のシンタックス要素が前記非正方形変換タイプを示す場合、前記非正方形変換タイプを有する各変換区分に関する変換方向を示す第2のシンタックス要素を受信することと、ここにおいて、前記変換方向は水平方向に配向された方向および垂直方向に配向された方向のうちの少なくとも1つから選択され、
前記受信した第1および第2のシンタックス要素に従って、前記予測ユニットの前記変換区分を決定することC。
[C16]
C15に記載のビデオ符号化方法であって、当該方法は下記を具備する。
前記予測ユニットが4分木構造のレベル1にあることC。
[C17]
C15に記載のビデオ符号化方法であって、当該方法は下記を具備する。
前記第1および第2のシンタックス要素を前記コーディングユニットレベルで受信すること、ここにおいて、前記変換区分を決定することは、前記複数の予測ユニットの各々が同じ変換区分を有するように、前記コーディングユニットに関する前記変換区分を決定することC。
[C18]
C15に記載のビデオ符号化方法であって、当該方法は下記を具備する。
前記第1および第2のシンタックス要素を前記予測ユニットレベルで受信すること、ここにおいて、前記変換区分を決定することは、前記複数の予測ユニットのそれぞれについて前記変換区分を別々に決定するC。
[C19]
C15に記載のビデオ符号化方法であって、当該方法は下記を具備する。
前記複数の予測ユニットのうちの1つまたは複数を、前記決定された変換区分に従ってサブブロックに区分することと、
特定の予測ユニットが分離していることを示す第3のシンタックス要素を受信することと、ここにおいて、前記第3のシンタックス要素が前記サブブロックレベルでシグナリングされ、
前記第3のシンタックス要素に基づいて、それぞれの前記サブブロックについてさらなる区分タイプを決定することC。
[C20]
C19に記載のビデオ符号化方法であって、当該方法は下記を具備する。
前記サブブロックが2またはそれ以上の4分木分解レベルにあることC。
[C21]
C19に記載のビデオ符号化方法であって、当該方法は下記を具備する。
前記第1のシンタックス要素が受信された場合、前記さらなる区分タイプを示す少なくとも第4のシンタックス要素を受信すること
C。
[C22]
C19に記載のビデオ符号化方法であって、当該方法は下記を具備する。
前記さらなる区分タイプは、前記複数の予測ユニットをサブブロックに区分するために使用された前記決定された変換区分に基づいて決定されることC。
[C23]
C19に記載のビデオ符号化方法であって、当該方法は下記を具備する。
前記さらなる区分タイプを1つの変換タイプと1つの変換方向とに限定すること
C。
[C24]
C19に記載のビデオ符号化方法であって、当該方法は下記を具備する。
前記サブブロックの前記さらなる区分タイプは、前記サブブロックの区分サイズに基づいて決定されることC。
[C25]
C15に記載のビデオ符号化方法であって、当該方法は下記を具備する。
逆変換を前記変換区分の各々に適用して、残差予測データを復号化すること
C。
[C26]
C25に記載のビデオ符号化方法であって、当該方法は下記を具備する。
イントラ予測を使用して前記残差予測データを復号化して、復号化ビデオデータを生成すること
C。
[C27]
コーディングユニットを複数の予測ユニットに区分することであって、ここにおいて、前記コーディングユニットはイントラ予測を使用して符号化されることと、
前記予測ユニットに関する変換区分を決定することであって、ここにおいて、前記変換区分のうちの少なくとも1つが非正方形区分であることと、
を行うように構成されたビデオエンコーダ
を備えるビデオ符号化装置。
[C28]
前記予測ユニットが4分木構造のレベル1にある、C27に記載のビデオ符号化装置。
[C29]
前記ビデオエンコーダが、前記複数の予測ユニットの各々が同じ変換区分を有するように、前記コーディングユニットに関する前記変換区分を決定するようにさらに構成される、C27に記載のビデオ符号化装置。
[C30]
前記ビデオエンコーダが、
前記コーディングユニットに関する変換タイプを示す第1のシンタックス要素をシグナリングすることであって、ここにおいて、前記変換タイプは正方形変換区分および非正方形変換区分のうちの少なくとも1つから選択されることと、
前記第1のシンタックス要素が前記非正方形変換タイプを示す場合、前記非正方形変換タイプを有する各変換区分に関する変換方向を示す第2のシンタックス要素をシグナリングすることであって、ここにおいて、前記変換方向は水平方向に配向された方向および垂直方向に配向された方向のうちの少なくとも1つから選択されることと
を行うようにさらに構成される、C29に記載のビデオ符号化装置。
[C31]
前記ビデオエンコーダは、前記複数の予測ユニットのそれぞれについて前記変換区分を別々に決定するようにさらに構成される、C27に記載のビデオ符号化装置。
[C32]
前記ビデオエンコーダが、
前記複数の予測ユニットの各々の変換タイプを示す第1のシンタックス要素をシグナリングすることであって、ここにおいて、前記変換タイプは正方形変換区分および非正方形変換区分のうちの少なくとも1つから選択されることと、
前記第1のシンタックス要素が前記非正方形変換タイプを示す場合、前記非正方形変換タイプを有するそれぞれの変換区分について変換方向を示す第2のシンタックス要素をシグナリングすることであって、ここにおいて、前記変換方向は水平方向に配向された方向および垂直方向に配向された方向のうちの少なくとも1つから選択されることと
を行うようにさらに構成される、C31に記載のビデオ符号化装置。
[C33]
前記ビデオエンコーダが、
前記複数の予測ユニットのうちの前記1つまたは複数を、前記決定された変換区分に従ってサブブロックに区分することと、
それぞれの前記サブブロックについてさらなる区分タイプを決定することと、
特定の予測ユニットが分離していることを示すため、第1のシンタックス要素をシグナリングすることであって、ここにおいて、前記第1のシンタックス要素が前記サブブロックレベルでシグナリングされることと
を行うようにさらに構成される、C27に記載のビデオ符号化装置。
[C34]
前記サブブロックが2またはそれ以上の4分木分解レベルにある、C33に記載のビデオ符号化装置。
[C35]
前記ビデオエンコーダが、
前記第1のシンタックス要素がシグナリングされる場合、前記決定されたさらなる区分タイプを示す少なくとも第2のシンタックス要素をシグナリングする
ようにさらに構成される、C33に記載のビデオ符号化装置。
[C36]
前記さらなる区分タイプは、前記複数の予測ユニットをサブブロックに区分するために使用された前記決定された変換区分に基づいて決定される、C33に記載のビデオ符号化装置。
[C37]
前記ビデオエンコーダが、
前記さらなる区分タイプを1つの変換タイプと1つの変換方向とに限定する
ようにさらに構成される、C33に記載のビデオ符号化装置。
[C38]
前記サブブロックの前記さらなる区分タイプは、前記サブブロックの区分サイズに基づいて決定される、C33に記載のビデオ符号化装置。
[C39]
前記ビデオエンコーダが、
変換を前記変換区分の各々に適用して、残差予測データを符号化する
ようにさらに構成される、C27に記載のビデオ符号化装置。
[C40]
コーディングユニットを複数の予測ユニットに区分することであって、ここにおいて、前記コーディングユニットはイントラ予測を使用して符号化されることと、
前記予測ユニットに関する変換区分を決定することであって、ここにおいて、前記変換区分のうちの少なくとも1つが非正方形区分であることと
を行うように構成されたビデオデコーダ
を備えるビデオ復号化装置。
[C41]
前記ビデオデコーダが、
変換タイプを示す第1のシンタックス要素を受信することであって、ここにおいて、前記変換タイプは正方形変換区分および非正方形変換区分のうちの少なくとも1つから選択されることと、
前記第1のシンタックス要素が前記非正方形変換タイプを示す場合、前記非正方形変換タイプを有する各変換区分に関する変換方向を示す第2のシンタックス要素を受信することであって、ここにおいて、前記変換方向は水平方向に配向された方向および垂直方向に配向された方向のうちの少なくとも1つから選択されることと、
前記受信した第1および第2のシンタックス要素に従って、前記予測ユニットの前記変換区分を決定することと
を行うようにさらに構成される、C40に記載のビデオ復号化装置。
[C42]
前記予測ユニットが4分木構造のレベル1にある、C41に記載のビデオ復号化装置。
[C43]
前記ビデオデコーダが、
前記第1および第2のシンタックス要素を前記コーディングユニットレベルで受信するようにさらに構成され、ここにおいて、前記変換区分を決定することは、前記複数の予測ユニットの各々が同じ変換区分を有するように、前記コーディングユニットに関する前記変換区分を決定することを備える、
C41に記載のビデオ復号化装置。
[C44]
前記ビデオデコーダが、
前記第1および第2のシンタックス要素を前記予測ユニットレベルで受信するようにさらに構成され、前記変換区分を決定することは、前記複数の予測ユニットのそれぞれについて前記変換区分を別々に決定することを備える、
C41に記載のビデオ復号化装置。
[C45]
前記ビデオデコーダが、
前記複数の予測ユニットのうちの1つまたは複数を、前記決定された変換区分に従ってサブブロックに区分することと、
特定の予測ユニットが分離していることを示す第3のシンタックス要素を受信することであって、ここにおいて、前記第3のシンタックス要素が前記サブブロックレベルでシグナリングされることと、
前記第3のシンタックス要素に基づいて、それぞれの前記サブブロックについてさらなる区分タイプを決定することと
を行うようにさらに構成される、C41に記載のビデオ復号化装置。
[C46]
前記サブブロックが2またはそれ以上の4分木分解レベルにある、C45に記載のビデオ復号化装置。
[C47]
前記ビデオデコーダが、
前記第1のシンタックス要素が受信された場合、前記さらなる区分タイプを示す少なくとも第4のシンタックス要素を受信する
ようにさらに構成される、C45に記載のビデオ復号化装置。
[C48]
前記さらなる区分タイプは、前記複数の予測ユニットをサブブロックに区分するために使用された前記決定された変換区分に基づいて決定される、C45に記載のビデオ復号化装置。
[C49]
前記ビデオデコーダが、
前記さらなる区分タイプを1つの変換タイプと1つの変換方向とに限定する
ようにさらに構成される、C45に記載のビデオ復号化装置。
[C50]
前記サブブロックの前記さらなる区分タイプは、前記サブブロックの区分サイズに基づいて決定される、C45に記載のビデオ復号化装置。
[C51]
前記ビデオデコーダが、
逆変換を前記変換区分の各々に適用して、残差予測データを復号化する
ようにさらに構成される、C41に記載のビデオ復号化装置。
[C52]
前記ビデオデコーダが、
イントラ予測を使用して前記残差予測データを復号化して、復号化ビデオデータを生成する
ようにさらに構成される、C51に記載のビデオ復号化装置。
[C53]
コーディングユニットを複数の予測ユニットに区分するための手段であって、ここにおいて、前記コーディングユニットはイントラ予測を使用して符号化される、
前記予測ユニットに関する変換区分を決定するための手段であって、ここにおいて、前記変換区分のうちの少なくとも1つが非正方形区分である、
を備える、ビデオ符号化装置。
[C54]
コーディングユニットを複数の予測ユニットに区分するための手段であって、ここにおいて、前記コーディングユニットはイントラ予測を使用して符号化される、
前記予測ユニットに関する変換区分を決定するための手段であって、ここにおいて、前記変換区分のうちの少なくとも1つが非正方形区分である、
を備える、ビデオ復号化装置。
[C55]
実行されたとき、ビデオデータを符号化するように構成されたデバイスの1つまたは複数のプロセッサに、
コーディングユニットを複数の予測ユニットに区分することであって、ここにおいて、前記コーディングユニットはイントラ予測を使用して符号化されることと、
前記予測ユニットに関する変換区分を決定することであって、ここにおいて、前記変換区分のうちの少なくとも1つが非正方形区分であることと
を行わせる命令を記憶するコンピュータ可読記憶媒体。
[C56]
実行されたとき、ビデオデータを復号化するように構成されたデバイスの1つまたは複数のプロセッサに、
コーディングユニットを複数の予測ユニットに区分することであって、ここにおいて、前記コーディングユニットはイントラ予測を使用して符号化されることと、
前記予測ユニットに関する変換区分を決定することであって、ここにおいて、前記変換区分のうちの少なくとも1つが非正方形区分であることと
を行わせる命令を記憶するコンピュータ可読記憶媒体。

Claims (56)

  1. ビデオ符号化方法であって、当該方法は下記を具備する。
    コーディングユニットを複数の予測ユニットに区分することと、ここにおいて、前記コーディングユニットはイントラ予測を使用して符号化され、
    前記予測ユニットに関する変換区分を決定することと、ここにおいて、前記変換区分のうちの少なくとも1つが非正方形区分である。
  2. 請求項1に記載のビデオ符号化方法であって、当該方法は下記を具備する。
    前記予測ユニットが4分木構造のレベル1にあること。
  3. 請求項1に記載のビデオ符号化方法であって、当該方法は下記を具備する。
    前記変換区分を決定することは、前記複数の予測ユニットの各々が同じ変換区分を有するように、前記コーディングユニットに関する前記変換区分を決定すること。
  4. 請求項3に記載のビデオ符号化方法であって、当該方法は下記を具備する。
    前記コーディングユニットに関する変換タイプを示す第1のシンタックス要素をシグナリングすることと、ここにおいて、前記変換タイプは正方形変換区分および非正方形変換区分のうちの少なくとも1つから選択され、
    前記第1のシンタックス要素が前記非正方形変換タイプを示す場合、前記非正方形変換タイプを有する各変換区分に関する変換方向を示す第2のシンタックス要素をシグナリングすることと、ここにおいて、前記変換方向は水平方向に配向された方向および垂直方向に配向された方向のうちの少なくとも1つから選択される。
  5. 請求項1に記載のビデオ符号化方法であって、当該方法は下記を具備する。
    前記変換区分を決定することは、前記複数の予測ユニットのそれぞれについて前記変換区分を別々に決定すること。
  6. 請求項5に記載のビデオ符号化方法であって、当該方法は下記を具備する。
    前記複数の予測ユニットの各々の変換タイプを示す第1のシンタックス要素をシグナリングすることと、ここにおいて、前記変換タイプは正方形変換区分および非正方形変換区分のうちの少なくとも1つから選択され、
    前記第1のシンタックス要素が前記非正方形変換タイプを示す場合、前記非正方形変換タイプを有するそれぞれの変換区分について変換方向を示す第2のシンタックス要素をシグナリングすることと、ここにおいて、前記変換方向は水平方向に配向された方向および垂直方向に配向された方向のうちの少なくとも1つから選択される。
  7. 請求項1に記載のビデオ符号化方法であって、当該方法は下記を具備する。
    前記複数の予測ユニットのうちの前記1つまたは複数を、前記決定された変換区分に従ってサブブロックに区分することと、
    それぞれの前記サブブロックについてさらなる区分タイプを決定することと、
    特定の予測ユニットが分離していることを示すため、第1のシンタックス要素をシグナリングすることであって、ここにおいて、前記第1のシンタックス要素が前記サブブロックレベルでシグナリングされること。
  8. 請求項7に記載のビデオ符号化方法であって、当該方法は下記を具備する。
    前記サブブロックが2またはそれ以上の4分木分解レベルにあること。
  9. 請求項7に記載のビデオ符号化方法であって、当該方法は下記を具備する。
    前記第1のシンタックス要素がシグナリングされる場合、前記決定されたさらなる区分タイプを示す少なくとも第2のシンタックス要素をシグナリングすること。
  10. 請求項7に記載のビデオ符号化方法であって、当該方法は下記を具備する。
    前記さらなる区分タイプは、前記複数の予測ユニットをサブブロックに区分するために使用された前記決定された変換区分に基づいて決定されること。
  11. 請求項7に記載のビデオ符号化方法であって、当該方法は下記を具備する。
    前記さらなる区分タイプを1つの変換タイプと1つの変換方向とに限定すること
  12. 請求項7に記載のビデオ符号化方法であって、当該方法は下記を具備する。
    前記サブブロックの前記さらなる区分タイプは、前記サブブロックの区分サイズに基づいて決定されること。
  13. 請求項1に記載のビデオ符号化方法であって、当該方法は下記を具備する。
    変換を前記変換区分の各々に適用して、残差予測データを符号化すること
  14. ビデオ復号化方法であって、当該方法は下記を具備する。
    コーディングユニットを複数の予測ユニットに区分することと、ここにおいて、前記コーディングユニットはイントラ予測を使用して符号化され、
    前記予測ユニットに関する変換区分を決定すること、ここにおいて、前記変換区分のうちの少なくとも1つが非正方形区分である。
  15. 請求項14に記載のビデオ符号化方法であって、当該方法は下記を具備する。
    変換タイプを示す第1のシンタックス要素を受信することと、ここにおいて、前記変換タイプは正方形変換区分および非正方形変換区分のうちの少なくとも1つから選択され、
    前記第1のシンタックス要素が前記非正方形変換タイプを示す場合、前記非正方形変換タイプを有する各変換区分に関する変換方向を示す第2のシンタックス要素を受信することと、ここにおいて、前記変換方向は水平方向に配向された方向および垂直方向に配向された方向のうちの少なくとも1つから選択され、
    前記受信した第1および第2のシンタックス要素に従って、前記予測ユニットの前記変換区分を決定すること。
  16. 請求項15に記載のビデオ符号化方法であって、当該方法は下記を具備する。
    前記予測ユニットが4分木構造のレベル1にあること。
  17. 請求項15に記載のビデオ符号化方法であって、当該方法は下記を具備する。
    前記第1および第2のシンタックス要素を前記コーディングユニットレベルで受信すること、ここにおいて、前記変換区分を決定することは、前記複数の予測ユニットの各々が同じ変換区分を有するように、前記コーディングユニットに関する前記変換区分を決定すること。
  18. 請求項15に記載のビデオ符号化方法であって、当該方法は下記を具備する。
    前記第1および第2のシンタックス要素を前記予測ユニットレベルで受信すること、ここにおいて、前記変換区分を決定することは、前記複数の予測ユニットのそれぞれについて前記変換区分を別々に決定する。
  19. 請求項15に記載のビデオ符号化方法であって、当該方法は下記を具備する。
    前記複数の予測ユニットのうちの1つまたは複数を、前記決定された変換区分に従ってサブブロックに区分することと、
    特定の予測ユニットが分離していることを示す第3のシンタックス要素を受信することと、ここにおいて、前記第3のシンタックス要素が前記サブブロックレベルでシグナリングされ、
    前記第3のシンタックス要素に基づいて、それぞれの前記サブブロックについてさらなる区分タイプを決定すること。
  20. 請求項19に記載のビデオ符号化方法であって、当該方法は下記を具備する。
    前記サブブロックが2またはそれ以上の4分木分解レベルにあること。
  21. 請求項19に記載のビデオ符号化方法であって、当該方法は下記を具備する。
    前記第1のシンタックス要素が受信された場合、前記さらなる区分タイプを示す少なくとも第4のシンタックス要素を受信すること
  22. 請求項19に記載のビデオ符号化方法であって、当該方法は下記を具備する。
    前記さらなる区分タイプは、前記複数の予測ユニットをサブブロックに区分するために使用された前記決定された変換区分に基づいて決定されること。
  23. 請求項19に記載のビデオ符号化方法であって、当該方法は下記を具備する。
    前記さらなる区分タイプを1つの変換タイプと1つの変換方向とに限定すること
  24. 請求項19に記載のビデオ符号化方法であって、当該方法は下記を具備する。
    前記サブブロックの前記さらなる区分タイプは、前記サブブロックの区分サイズに基づいて決定されること。
  25. 請求項15に記載のビデオ符号化方法であって、当該方法は下記を具備する。
    逆変換を前記変換区分の各々に適用して、残差予測データを復号化すること
  26. 請求項25に記載のビデオ符号化方法であって、当該方法は下記を具備する。
    イントラ予測を使用して前記残差予測データを復号化して、復号化ビデオデータを生成すること
  27. コーディングユニットを複数の予測ユニットに区分することであって、ここにおいて、前記コーディングユニットはイントラ予測を使用して符号化されることと、
    前記予測ユニットに関する変換区分を決定することであって、ここにおいて、前記変換区分のうちの少なくとも1つが非正方形区分であることと、
    を行うように構成されたビデオエンコーダ
    を備えるビデオ符号化装置。
  28. 前記予測ユニットが4分木構造のレベル1にある、請求項27に記載のビデオ符号化装置。
  29. 前記ビデオエンコーダが、前記複数の予測ユニットの各々が同じ変換区分を有するように、前記コーディングユニットに関する前記変換区分を決定するようにさらに構成される、請求項27に記載のビデオ符号化装置。
  30. 前記ビデオエンコーダが、
    前記コーディングユニットに関する変換タイプを示す第1のシンタックス要素をシグナリングすることであって、ここにおいて、前記変換タイプは正方形変換区分および非正方形変換区分のうちの少なくとも1つから選択されることと、
    前記第1のシンタックス要素が前記非正方形変換タイプを示す場合、前記非正方形変換タイプを有する各変換区分に関する変換方向を示す第2のシンタックス要素をシグナリングすることであって、ここにおいて、前記変換方向は水平方向に配向された方向および垂直方向に配向された方向のうちの少なくとも1つから選択されることと
    を行うようにさらに構成される、請求項29に記載のビデオ符号化装置。
  31. 前記ビデオエンコーダは、前記複数の予測ユニットのそれぞれについて前記変換区分を別々に決定するようにさらに構成される、請求項27に記載のビデオ符号化装置。
  32. 前記ビデオエンコーダが、
    前記複数の予測ユニットの各々の変換タイプを示す第1のシンタックス要素をシグナリングすることであって、ここにおいて、前記変換タイプは正方形変換区分および非正方形変換区分のうちの少なくとも1つから選択されることと、
    前記第1のシンタックス要素が前記非正方形変換タイプを示す場合、前記非正方形変換タイプを有するそれぞれの変換区分について変換方向を示す第2のシンタックス要素をシグナリングすることであって、ここにおいて、前記変換方向は水平方向に配向された方向および垂直方向に配向された方向のうちの少なくとも1つから選択されることと
    を行うようにさらに構成される、請求項31に記載のビデオ符号化装置。
  33. 前記ビデオエンコーダが、
    前記複数の予測ユニットのうちの前記1つまたは複数を、前記決定された変換区分に従ってサブブロックに区分することと、
    それぞれの前記サブブロックについてさらなる区分タイプを決定することと、
    特定の予測ユニットが分離していることを示すため、第1のシンタックス要素をシグナリングすることであって、ここにおいて、前記第1のシンタックス要素が前記サブブロックレベルでシグナリングされることと
    を行うようにさらに構成される、請求項27に記載のビデオ符号化装置。
  34. 前記サブブロックが2またはそれ以上の4分木分解レベルにある、請求項33に記載のビデオ符号化装置。
  35. 前記ビデオエンコーダが、
    前記第1のシンタックス要素がシグナリングされる場合、前記決定されたさらなる区分タイプを示す少なくとも第2のシンタックス要素をシグナリングする
    ようにさらに構成される、請求項33に記載のビデオ符号化装置。
  36. 前記さらなる区分タイプは、前記複数の予測ユニットをサブブロックに区分するために使用された前記決定された変換区分に基づいて決定される、請求項33に記載のビデオ符号化装置。
  37. 前記ビデオエンコーダが、
    前記さらなる区分タイプを1つの変換タイプと1つの変換方向とに限定する
    ようにさらに構成される、請求項33に記載のビデオ符号化装置。
  38. 前記サブブロックの前記さらなる区分タイプは、前記サブブロックの区分サイズに基づいて決定される、請求項33に記載のビデオ符号化装置。
  39. 前記ビデオエンコーダが、
    変換を前記変換区分の各々に適用して、残差予測データを符号化する
    ようにさらに構成される、請求項27に記載のビデオ符号化装置。
  40. コーディングユニットを複数の予測ユニットに区分することであって、ここにおいて、前記コーディングユニットはイントラ予測を使用して符号化されることと、
    前記予測ユニットに関する変換区分を決定することであって、ここにおいて、前記変換区分のうちの少なくとも1つが非正方形区分であることと
    を行うように構成されたビデオデコーダ
    を備えるビデオ復号化装置。
  41. 前記ビデオデコーダが、
    変換タイプを示す第1のシンタックス要素を受信することであって、ここにおいて、前記変換タイプは正方形変換区分および非正方形変換区分のうちの少なくとも1つから選択されることと、
    前記第1のシンタックス要素が前記非正方形変換タイプを示す場合、前記非正方形変換タイプを有する各変換区分に関する変換方向を示す第2のシンタックス要素を受信することであって、ここにおいて、前記変換方向は水平方向に配向された方向および垂直方向に配向された方向のうちの少なくとも1つから選択されることと、
    前記受信した第1および第2のシンタックス要素に従って、前記予測ユニットの前記変換区分を決定することと
    を行うようにさらに構成される、請求項40に記載のビデオ復号化装置。
  42. 前記予測ユニットが4分木構造のレベル1にある、請求項41に記載のビデオ復号化装置。
  43. 前記ビデオデコーダが、
    前記第1および第2のシンタックス要素を前記コーディングユニットレベルで受信するようにさらに構成され、ここにおいて、前記変換区分を決定することは、前記複数の予測ユニットの各々が同じ変換区分を有するように、前記コーディングユニットに関する前記変換区分を決定することを備える、
    請求項41に記載のビデオ復号化装置。
  44. 前記ビデオデコーダが、
    前記第1および第2のシンタックス要素を前記予測ユニットレベルで受信するようにさらに構成され、前記変換区分を決定することは、前記複数の予測ユニットのそれぞれについて前記変換区分を別々に決定することを備える、
    請求項41に記載のビデオ復号化装置。
  45. 前記ビデオデコーダが、
    前記複数の予測ユニットのうちの1つまたは複数を、前記決定された変換区分に従ってサブブロックに区分することと、
    特定の予測ユニットが分離していることを示す第3のシンタックス要素を受信することであって、ここにおいて、前記第3のシンタックス要素が前記サブブロックレベルでシグナリングされることと、
    前記第3のシンタックス要素に基づいて、それぞれの前記サブブロックについてさらなる区分タイプを決定することと
    を行うようにさらに構成される、請求項41に記載のビデオ復号化装置。
  46. 前記サブブロックが2またはそれ以上の4分木分解レベルにある、請求項45に記載のビデオ復号化装置。
  47. 前記ビデオデコーダが、
    前記第1のシンタックス要素が受信された場合、前記さらなる区分タイプを示す少なくとも第4のシンタックス要素を受信する
    ようにさらに構成される、請求項45に記載のビデオ復号化装置。
  48. 前記さらなる区分タイプは、前記複数の予測ユニットをサブブロックに区分するために使用された前記決定された変換区分に基づいて決定される、請求項45に記載のビデオ復号化装置。
  49. 前記ビデオデコーダが、
    前記さらなる区分タイプを1つの変換タイプと1つの変換方向とに限定する
    ようにさらに構成される、請求項45に記載のビデオ復号化装置。
  50. 前記サブブロックの前記さらなる区分タイプは、前記サブブロックの区分サイズに基づいて決定される、請求項45に記載のビデオ復号化装置。
  51. 前記ビデオデコーダが、
    逆変換を前記変換区分の各々に適用して、残差予測データを復号化する
    ようにさらに構成される、請求項41に記載のビデオ復号化装置。
  52. 前記ビデオデコーダが、
    イントラ予測を使用して前記残差予測データを復号化して、復号化ビデオデータを生成する
    ようにさらに構成される、請求項51に記載のビデオ復号化装置。
  53. コーディングユニットを複数の予測ユニットに区分するための手段であって、ここにおいて、前記コーディングユニットはイントラ予測を使用して符号化される、
    前記予測ユニットに関する変換区分を決定するための手段であって、ここにおいて、前記変換区分のうちの少なくとも1つが非正方形区分である、
    を備える、ビデオ符号化装置。
  54. コーディングユニットを複数の予測ユニットに区分するための手段であって、ここにおいて、前記コーディングユニットはイントラ予測を使用して符号化される、
    前記予測ユニットに関する変換区分を決定するための手段であって、ここにおいて、前記変換区分のうちの少なくとも1つが非正方形区分である、
    を備える、ビデオ復号化装置。
  55. 実行されたとき、ビデオデータを符号化するように構成されたデバイスの1つまたは複数のプロセッサに、
    コーディングユニットを複数の予測ユニットに区分することであって、ここにおいて、前記コーディングユニットはイントラ予測を使用して符号化されることと、
    前記予測ユニットに関する変換区分を決定することであって、ここにおいて、前記変換区分のうちの少なくとも1つが非正方形区分であることと
    を行わせる命令を記憶するコンピュータ可読記憶媒体。
  56. 実行されたとき、ビデオデータを復号化するように構成されたデバイスの1つまたは複数のプロセッサに、
    コーディングユニットを複数の予測ユニットに区分することであって、ここにおいて、前記コーディングユニットはイントラ予測を使用して符号化されることと、
    前記予測ユニットに関する変換区分を決定することであって、ここにおいて、前記変換区分のうちの少なくとも1つが非正方形区分であることと
    を行わせる命令を記憶するコンピュータ可読記憶媒体。
JP2014539000A 2011-10-27 2012-10-25 イントラ予測ビデオコーディングにおける非正方形変換 Expired - Fee Related JP5886440B2 (ja)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201161552327P 2011-10-27 2011-10-27
US61/552,327 2011-10-27
US13/659,546 2012-10-24
US13/659,546 US9247254B2 (en) 2011-10-27 2012-10-24 Non-square transforms in intra-prediction video coding
PCT/US2012/061878 WO2013063245A1 (en) 2011-10-27 2012-10-25 Non-square transforms in intra-prediction video coding

Publications (2)

Publication Number Publication Date
JP2014534734A true JP2014534734A (ja) 2014-12-18
JP5886440B2 JP5886440B2 (ja) 2016-03-16

Family

ID=47190153

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014539000A Expired - Fee Related JP5886440B2 (ja) 2011-10-27 2012-10-25 イントラ予測ビデオコーディングにおける非正方形変換

Country Status (7)

Country Link
US (1) US9247254B2 (ja)
EP (1) EP2772054A1 (ja)
JP (1) JP5886440B2 (ja)
KR (1) KR101617109B1 (ja)
CN (1) CN103931182B (ja)
IN (1) IN2014CN02638A (ja)
WO (1) WO2013063245A1 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20180056396A (ko) * 2016-11-18 2018-05-28 주식회사 케이티 비디오 신호 처리 방법 및 장치
JP2019514308A (ja) * 2016-05-10 2019-05-30 サムスン エレクトロニクス カンパニー リミテッド 映像を符号化/復号する方法及びその装置
US12126801B2 (en) 2023-05-08 2024-10-22 Samsung Electronics Co., Ltd. Method for encoding/decoding image and device therefor

Families Citing this family (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013023518A1 (en) * 2011-08-17 2013-02-21 Mediatek Singapore Pte. Ltd. Method and apparatus for intra prediction using non-square blocks
CA2923439C (en) * 2013-10-14 2018-08-21 Mediatek Singapore Pte. Ltd. Method of residue differential pulse-code modulation for hevc range extension
WO2016136106A1 (ja) * 2015-02-27 2016-09-01 Kddi株式会社 符号化装置及び復号装置
US9998739B2 (en) * 2015-03-06 2018-06-12 Qualcomm Incorporated Optimization for encoding video data using non-square partitions
US10638132B2 (en) * 2015-10-15 2020-04-28 Lg Electronics Inc. Method for encoding and decoding video signal, and apparatus therefor
US9955176B2 (en) 2015-11-30 2018-04-24 Intel Corporation Efficient and scalable intra video/image coding using wavelets and AVC, modified AVC, VPx, modified VPx, or modified HEVC coding
US20170155905A1 (en) * 2015-11-30 2017-06-01 Intel Corporation Efficient intra video/image coding using wavelets and variable size transform coding
US10602187B2 (en) 2015-11-30 2020-03-24 Intel Corporation Efficient, compatible, and scalable intra video/image coding using wavelets and HEVC coding
WO2017191782A1 (en) * 2016-05-04 2017-11-09 Sharp Kabushiki Kaisha Systems and methods for coding transform data
CN114222139A (zh) * 2016-05-28 2022-03-22 世宗大学校产学协力团 视频信号的解码方法
WO2018030746A1 (ko) * 2016-08-08 2018-02-15 엘지전자(주) 영상의 처리 방법 및 이를 위한 장치
EP3306927A1 (en) 2016-10-05 2018-04-11 Thomson Licensing Encoding and decoding methods and corresponding devices
KR102424411B1 (ko) * 2017-04-13 2022-07-25 엘지전자 주식회사 영상의 부호화/복호화 방법 및 이를 위한 장치
WO2019204212A1 (en) * 2018-04-18 2019-10-24 Futurewei Technologies, Inc. Block partitioning in video coding
US10798382B2 (en) * 2018-04-26 2020-10-06 Tencent America LLC Sub-block transform
WO2019212816A1 (en) * 2018-05-02 2019-11-07 Interdigital Vc Holdings, Inc. Encoding and decoding a video
WO2019234613A1 (en) * 2018-06-05 2019-12-12 Beijing Bytedance Network Technology Co., Ltd. Partition tree with partition into 3 sub-blocks by horizontal and vertical splits
TWI820195B (zh) * 2018-08-28 2023-11-01 大陸商北京字節跳動網絡技術有限公司 分割方法的冗餘移除
WO2020084602A1 (en) * 2018-10-26 2020-04-30 Beijing Bytedance Network Technology Co., Ltd. Signaling of partition information
KR20210096116A (ko) * 2018-12-03 2021-08-04 인터디지털 브이씨 홀딩스 인코포레이티드 픽처 인코딩 및 디코딩을 위한 방법 및 디바이스
US11533506B2 (en) * 2019-02-08 2022-12-20 Tencent America LLC Method and apparatus for video coding
WO2020171647A1 (ko) * 2019-02-21 2020-08-27 엘지전자 주식회사 영상 코딩 시스템에서 인트라 예측을 사용하는 영상 디코딩 방법 및 그 장치
US11825120B2 (en) * 2019-02-28 2023-11-21 Qualcomm Incorporated Subblock coding by generalized intra prediction in video coding
KR20240052873A (ko) * 2019-03-03 2024-04-23 후아웨이 테크놀러지 컴퍼니 리미티드 변환 프로세스를 위해 사용되는 인코더, 디코더 및 대응하는 방법
EP3723368A1 (en) * 2019-04-12 2020-10-14 InterDigital VC Holdings, Inc. Wide angle intra prediction with sub-partitions
SI4017008T1 (sl) * 2019-09-21 2024-08-30 Lg Electronics Inc. Kodiranje slik na podlagi transformacij
US11388401B2 (en) * 2020-06-26 2022-07-12 Google Llc Extended transform partitions for video compression
US11683515B2 (en) * 2021-01-27 2023-06-20 Tencent America LLC Video compression with adaptive iterative intra-prediction

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050249291A1 (en) * 2004-05-07 2005-11-10 Stephen Gordon Method and system for generating a transform size syntax element for video decoding
WO2010039822A2 (en) * 2008-10-03 2010-04-08 Qualcomm Incorporated VIDEO CODING USING TRANSFORMS BIGGER THAN 4x4 AND 8x8
US20110135000A1 (en) * 2009-12-09 2011-06-09 Samsung Electronics Co., Ltd. Method and apparatus for encoding video, and method and apparatus for decoding video
WO2013047805A1 (ja) * 2011-09-29 2013-04-04 シャープ株式会社 画像復号装置、画像復号方法および画像符号化装置

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08294119A (ja) * 1995-04-21 1996-11-05 Toshiba Corp 画像符号化/復号化装置
US8483285B2 (en) * 2008-10-03 2013-07-09 Qualcomm Incorporated Video coding using transforms bigger than 4×4 and 8×8
KR101672456B1 (ko) * 2009-02-09 2016-11-17 삼성전자 주식회사 저복잡도 주파수 변환을 이용한 비디오 부호화 방법과 그 장치, 및 비디오 복호화 방법과 그 장치
JPWO2010116869A1 (ja) 2009-04-08 2012-10-18 シャープ株式会社 動画像符号化装置および動画像復号装置
KR101712351B1 (ko) 2009-06-26 2017-03-06 에스케이 텔레콤주식회사 다차원 정수 변환을 이용한 영상 부호화/복호화 장치 및 방법
KR101456498B1 (ko) * 2009-08-14 2014-10-31 삼성전자주식회사 계층적 부호화 단위의 스캔 순서를 고려한 비디오 부호화 방법 및 장치, 비디오 복호화 방법 및 장치
KR101418101B1 (ko) * 2009-09-23 2014-07-16 에스케이 텔레콤주식회사 저주파수 성분을 고려한 영상 부호화/복호화 방법 및 장치
KR101503269B1 (ko) * 2010-04-05 2015-03-17 삼성전자주식회사 영상 부호화 단위에 대한 인트라 예측 모드 결정 방법 및 장치, 및 영상 복호화 단위에 대한 인트라 예측 모드 결정 방법 및 장치
US20120082225A1 (en) 2010-10-01 2012-04-05 Qualcomm Incorporated Selective indication of transform sizes
US20120147961A1 (en) 2010-12-09 2012-06-14 Qualcomm Incorporated Use of motion vectors in evaluating geometric partitioning modes
US8494290B2 (en) * 2011-05-05 2013-07-23 Mitsubishi Electric Research Laboratories, Inc. Method for coding pictures using hierarchical transform units

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050249291A1 (en) * 2004-05-07 2005-11-10 Stephen Gordon Method and system for generating a transform size syntax element for video decoding
WO2010039822A2 (en) * 2008-10-03 2010-04-08 Qualcomm Incorporated VIDEO CODING USING TRANSFORMS BIGGER THAN 4x4 AND 8x8
US20110135000A1 (en) * 2009-12-09 2011-06-09 Samsung Electronics Co., Ltd. Method and apparatus for encoding video, and method and apparatus for decoding video
WO2013047805A1 (ja) * 2011-09-29 2013-04-04 シャープ株式会社 画像復号装置、画像復号方法および画像符号化装置

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
JPN5015000316; Xiaoran Cao, et al.: 'CE6.b1 Report on Short Distance Intra Prediction Method' Joint Collaborative Team on Video Coding (JCT-VC) of ITU-T SG16 WP3 and ISO/IEC JTC1/SC29/WG11 5th M JCTVC-E278, 20110310 *
JPN6015020346; Krit Panusopone, et al.: 'RQT with rectangular transform unit support' Joint Collaborative Team on Video Coding (JCT-VC) of ITU-T SG16 WP3 and ISO/IEC JTC1/SC29/WG11 6th M JCTVC-F578-r3, 20110719, pp.1-4 *

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019514308A (ja) * 2016-05-10 2019-05-30 サムスン エレクトロニクス カンパニー リミテッド 映像を符号化/復号する方法及びその装置
US11019335B2 (en) 2016-05-10 2021-05-25 Samsung Electronics Co., Ltd. Method for encoding/decoding image and device therefor
US11770526B2 (en) 2016-05-10 2023-09-26 Samsung Electronics Co., Ltd. Method for encoding/decoding image and device therefor
JP7445042B2 (ja) 2016-05-10 2024-03-06 サムスン エレクトロニクス カンパニー リミテッド 映像を符号化/復号する方法及びその装置
KR20180056396A (ko) * 2016-11-18 2018-05-28 주식회사 케이티 비디오 신호 처리 방법 및 장치
KR102559061B1 (ko) 2016-11-18 2023-07-24 주식회사 케이티 비디오 신호 처리 방법 및 장치
US12126801B2 (en) 2023-05-08 2024-10-22 Samsung Electronics Co., Ltd. Method for encoding/decoding image and device therefor

Also Published As

Publication number Publication date
US9247254B2 (en) 2016-01-26
KR20140085548A (ko) 2014-07-07
WO2013063245A1 (en) 2013-05-02
EP2772054A1 (en) 2014-09-03
KR101617109B1 (ko) 2016-04-29
CN103931182B (zh) 2017-05-24
IN2014CN02638A (ja) 2015-08-07
US20130107950A1 (en) 2013-05-02
JP5886440B2 (ja) 2016-03-16
CN103931182A (zh) 2014-07-16

Similar Documents

Publication Publication Date Title
JP5886440B2 (ja) イントラ予測ビデオコーディングにおける非正方形変換
JP6022579B2 (ja) ビデオ・コーディングにおける非正方形変換ユニットおよび予測ユニット
JP5996661B2 (ja) イントラ予測コーディングのための最も可能性の高い変換
JP6254136B2 (ja) 統合されたマージモードおよび適応動きベクトル予測モード候補選択
JP6271477B2 (ja) 変換係数の関数ベース走査順序を使用するビデオ符号化
JP6174123B2 (ja) ビデオコーディングにおける量子化パラメータ(qp)コーディング
JP5797840B2 (ja) ビデオコーディングのための並列化フレンドリーなマージ候補
JP6250583B2 (ja) 隣接モードを使用したビデオコーディングのための拡張イントラ予測モードシグナリング
JP5922245B2 (ja) クロマ成分のための適応ループフィルタ処理
JP6113752B2 (ja) Cabac係数レベルコーディングのためのスループット改善
JP5922244B2 (ja) ビデオコーディングにおいて適応ループフィルタとマージされたサンプル適応オフセット
JP6445001B2 (ja) ビデオコーディングプロセスにおける係数レベルコーディングのためのライスパラメータ初期化
JP6162150B2 (ja) ビデオコーディング用の残差4分木(rqt)コーディング
JP5784830B2 (ja) ビデオコード化のための複数領域走査順序
JP5866453B2 (ja) イントラモードコーディングにおける参照モード選択
JP6105048B2 (ja) ビデオコーディングのための変換係数のコーディングにおけるグループフラグ
JP2013543317A (ja) ジョイントコンテキストモデルを使用した係数のエントロピー符号化
JP2014521281A (ja) ビデオコーディングにおけるピクチャサイズのシグナルリング
JP6067750B2 (ja) 並列動き推定範囲サイズの暗黙的導出

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20150518

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20150526

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20150820

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20160112

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20160210

R150 Certificate of patent or registration of utility model

Ref document number: 5886440

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees