JP6022579B2 - ビデオ・コーディングにおける非正方形変換ユニットおよび予測ユニット - Google Patents

ビデオ・コーディングにおける非正方形変換ユニットおよび予測ユニット Download PDF

Info

Publication number
JP6022579B2
JP6022579B2 JP2014530737A JP2014530737A JP6022579B2 JP 6022579 B2 JP6022579 B2 JP 6022579B2 JP 2014530737 A JP2014530737 A JP 2014530737A JP 2014530737 A JP2014530737 A JP 2014530737A JP 6022579 B2 JP6022579 B2 JP 6022579B2
Authority
JP
Japan
Prior art keywords
intra prediction
transform unit
partition
video
partitions
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2014530737A
Other languages
English (en)
Other versions
JP2014530537A (ja
Inventor
ワン、シャンリン
カークゼウィックズ、マルタ
グオ、リウェイ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Qualcomm Inc
Original Assignee
Qualcomm Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qualcomm Inc filed Critical Qualcomm Inc
Publication of JP2014530537A publication Critical patent/JP2014530537A/ja
Application granted granted Critical
Publication of JP6022579B2 publication Critical patent/JP6022579B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/11Selection of coding mode or of prediction mode among a plurality of spatial predictive coding modes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/12Selection from among a plurality of transforms or standards, e.g. selection between discrete cosine transform [DCT] and sub-band transform or selection between H.263 and H.264
    • H04N19/122Selection of transform size, e.g. 8x8 or 2x4x8 DCT; Selection of sub-band transforms of varying structure or type
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/593Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial prediction techniques

Description

優先権主張
本願は、その内容全体が参照によって本明細書に組み込まれている2011年9月12日に出願された米国仮特許出願61/533,703号と、2011年9月19日に出願された米国仮特許出願61/536,414号と、2011年10月27日に出願された米国仮特許出願61/552,216号との利益を主張する。
本開示はビデオ・コーディングに関し、さらに詳しくは、ビデオ・データをコーディングする場合における、イントラ予測ブロックのための変換ユニット・パーティションおよび予測ユニット・パーティションを選択し、シグナルする技術に関する。
デジタル・ビデオ機能は、デジタル・テレビ、デジタル・ダイレクト・ブロードキャスト・システム、無線ブロードキャスト・システム、携帯情報端末(PDA)、ラップトップ・コンピュータまたはデスクトップ・コンピュータ、デジタル・カメラ、デジタル記録デバイス、デジタル・メディア・プレーヤ、ビデオ・ゲーム・デバイス、ビデオ・ゲーム・コンソール、セル電話または衛星ラジオ電話、ビデオ・テレビ会議デバイス等を含む広範囲のデバイスに組み込まれうる。デジタル・ビデオ・デバイスは、デジタル・ビデオ情報をより効率的に送信、受信、および格納するために、例えば、MPEG−2、MPEG−4、ITU−T H.263、ITU−T H.264/MPEG−4、パート10、アドバンスト・ビデオ・コーディング(AVC)、現在開発中の高効率ビデオ・コーディング(HEVC)規格、およびこのような規格の拡張のようなビデオ圧縮技術を実施する。
ビデオ圧縮技術は、ビデオ・シーケンスにおいて特有の冗長性を低減または除去するため、空間予測および/または時間予測を含む。ブロック・ベースのビデオ・コーディングの場合、ビデオ・フレームまたはスライスは、複数のブロックへパーティションされうる。各ブロックはさらにパーティションされうる。イントラ・コード(I)フレームまたはスライスにおけるブロックは、同じフレームまたはスライスにおける近隣のブロックにおける基準サンプルに関する空間予測を用いてエンコードされる。インタ・コード(PまたはB)フレームまたはスライスにおけるブロックは、同じフレームまたはスライスにおける近隣ブロックにおける基準サンプル関して空間予測を用い、他の基準フレームにおける基準サンプルに関して時間予測を用いうる。空間予測または時間予測の結果、ブロックの予測ブロックがコーディングされるようになる。残余データは、コーディングされるべきオリジナルのブロックと、予測ブロックとの間のピクセル差分を表す。
インタ・コード・ブロックは、予測ブロックを生成する基準サンプルのブロックを指す動きベクトルと、コーディングされたブロックと予測ブロックとの間の差分を示す残余データとにしたがってエンコードされる。イントラ・コード・ブロックは、イントラ・コーディング・モードと残余データとにしたがってエンコードされる。さらなる圧縮のため、残余データは、ピクセル領域から変換領域へ変換され、残余変換係数となる。残余変換係数は、その後、量子化されうる。最初は2次元配列で構成された、量子化された変換係数が、特定の順番でスキャンされ、エントロピ・コーディングのための変換係数の1次元ベクトルが生成される。
一般に、本開示は、ビデオ・データをコーディングするための技術を記載する。本開示は、非正方形変換パーティションを許容するビデオ・エンコード処理において、変換パーティションを選択しシグナルするための技術を記載する。いくつかの例において、変換パーティションは、イントラ予測コーディング・モードに基づいて選択される。別の例では、変換パーティションは、予測ユニットのサイズまたは形状に依存しないが、予測残余におけるテストから独立して選択されうる。さらに、本開示は、短距離イントラ予測(SDIP)パーティションのために利用可能なイントラ・モード・セットの数を低減することによって、エンコードされたビデオ・ビット・レートを減少させ、エンコーダ複雑さを低減させるための技術を記載する。
本開示の一例では、ビデオ・エンコーダは、ビデオ・データのブロックの複数の予測ユニット・パーティションから、予測ユニット・パーティションを決定し、決定された予測ユニット・パーティションに基づいて、イントラ予測モードのセットを決定する、ように構成されうる。一例では、決定された予測ユニット・パーティションは、垂直方向の非正方形予測ユニット・パーティションであり、イントラ予測モードのセットは、垂直方向のイントラ予測モードを含む。別の例では、決定された予測ユニット・パーティションは、水平方向の非正方形予測ユニット・パーティションであり、イントラ予測モードのセットは、水平方向のイントラ予測モードを含む。
本開示の別の例では、ビデオ・エンコーダはさらに、ビデオ・データのブロックのため、イントラ予測モードのセットから、イントラ予測モードを決定し、決定されたイントラ予測モードに基づいて、ビデオ・データのブロックの変換ユニット・パーティションを決定し、決定された変換ユニット・パーティションを用いて、ビデオ・データのブロックをエンコードする、ように構成されうる。
本開示の別の例では、ビデオ・エンコーダは、イントラ予測モードに基づいて、変換ユニット・パーティションのセットから、変換ユニット・パーティションを決定するように構成されうる。一例において、決定されたイントラ予測モードは、垂直方向のイントラ予測モードであり、変換ユニット・パーティションのセットは、垂直方向の非正方形変換ユニット・パーティションを含む。別の例では、決定されたイントラ予測モードは、水平方向のイントラ予測モードであり、変換ユニット・パーティションのセットは、水平方向の非正方形変換ユニット・パーティションを含む。さらなる別の例では、決定されたイントラ予測モードは、DCモード、平面モード、または対角モードであり、変換ユニット・パーティションのセットは、正方形変換ユニット・パーティションを含む。
本開示の別の例では、ビデオ・デコーダは、ビデオ・データのブロックのため、複数の予測ユニット・パーティションから、予測ユニット・パーティションを示すインジケーションを受信し、予測ユニット・パーティションに基づいて、イントラ予測モードのセットを決定する、ように構成されうる。一例では、予測ユニット・パーティションは、垂直方向の非正方形予測ユニット・パーティションであり、イントラ予測モードのセットは、垂直方向のイントラ予測モードを含む。別の例では、予測ユニット・パーティションは、水平方向の非正方形予測ユニット・パーティションであり、イントラ予測モードのセットは、水平方向のイントラ予測モードを含む。
本開示の別の例では、ビデオ・デコーダはさらに、ビデオ・データのブロックのため、イントラ予測モードのセットから、イントラ予測モードを示すインジケーションを受信し、決定されたイントラ予測モードに基づいて、ビデオ・データのブロックの変換ユニット・パーティションを決定し、決定された変換ユニット・パーティションを用いて、ビデオ・データのブロックをデコードする、ように構成されうる。
本開示の別の例では、ビデオ・デコーダは、イントラ予測モードに基づいて、変換ユニット・パーティションのセットから、変換ユニット・パーティションを決定するように構成されうる。一例において、決定されたイントラ予測モードは、垂直方向のイントラ予測モードであり、変換ユニット・パーティションのセットは、垂直方向の非正方形変換ユニット・パーティションを含む。別の例では、決定されたイントラ予測モードは、水平方向のイントラ予測モードであり、変換ユニット・パーティションのセットは、水平方向の非正方形変換ユニット・パーティションを含む。さらなる別の例では、決定されたイントラ予測モードは、DCモード、平面モード、または対角モードであり、変換ユニット・パーティションのセットは、正方形変換ユニット・パーティションを含む。
本開示の例はまた、方法、装置、デバイス、およびコンピュータ読取可能な記憶媒体の観点から記載されるだろう。
1または複数の例の詳細が、添付図面および以下の説明において述べられる。他の特徴、目的、および利点が、説明と図面から、および特許請求の範囲から明らかになるだろう。
図1は、本開示の例にしたがって動作するビデオ・エンコードおよびデコード・システムを例示するブロック図である。 図2は、イントラ予測モード方向の例を例示する概念図である。 図3は、クワッド・ツリー・ブロック構造の例の概念図である。 図4Aは、垂直方向の非正方形変換および予測パーティションの例の概念図である。 図4Bは、水平方向の非正方形変換パーティションおよび予測パーティションの例の概念図である。 図5Aは、イントラ予測ブロックのための正方形変換ユニット・パーティションの例の概念図である。 図5Bは、イントラ予測ブロックのための非正方形変換ユニット・パーティションの例の概念図である。 図6は、イントラ予測のための予測ユニットの例の概念図である。 図7は、本開示の例にしたがって動作するビデオ・エンコーダの例を例示するブロック図である。 図8は、本開示の例にしたがって動作するビデオ・デコーダの例を例示するブロック図である。 図9は、本開示の例にしたがうビデオ・エンコード方法の例を図示するフローチャートである。 図10は、本開示の例にしたがうビデオ・デコード方法の例を図示するフローチャートである。
一般に、本開示は、ビデオ・データをコーディングするための技術を記載する。本開示は、ビデオ・コーディング処理において、変換ユニット(TU)パーティションおよび/または予測ユニット(PU)パーティションを選択しシグナルするための技術を記載する。特に、本開示の技術の例は、非正方形TUパーティションおよび/または非正方形PU変換の使用を許容する。
イントラ予測ブロックの場合、TUがPUとカップルされる(すなわち、これらは同じサイズおよび/または形状を有している)ので、ユニークな各TUパーティションが、ユニークなPUパーティションとマッチするので、ブロック内のTUパーティションの異なるオプションをチェックすることは、複数の予測および再構築を実行することを含みうる。その結果、エンコードの複雑さは、さらなる非正方形パーティションがチェックおよびシグナルされるとともに著しく高くなる。この高いエンコーダ複雑さは、いくつかの状況では、イントラ予測ブロックをコーディングするための正方形変換に加えて、非正方形変換を用いることを非現実的にしうる。これらの欠点を考慮して、本開示は、コーディング効率を維持しながら、イントラ予測ブロックの非正方形TUパーティションを、低減された複雑さで可能にすることを目的としている。
本開示は、これらの欠点に対処するためのいくつかの技術を示す。一例として、所与のイントラ予測ブロックの場合、いくつかの条件に基づいて、低減された数のTUパーティション・オプションが可能となる。別の例では、本開示は、イントラ予測ブロックについて、PUからTUをデカップルすることを提案する。所与のPUの場合、対応するPUからの異なるサイズおよび形状のTUが適用されうる。この場合、特定のPUのための残余データを変換するために使用される少なくともいくつかのTUは、このようなPUとは異なるサイズおよび/または形状を有しうる。その結果、異なるTUパーティションをチェックすることは、ブロックの対応する予測を個別に取得することを必要としないであろう。なぜなら、異なるTU形状が、1つのPUサイズおよび形状から取得された予測に適用されうるからである。
例えば、短距離イントラ予測(SDIP)を用いた非正方形PUを用いる場合、各PUは、複数のイントラ予測モード/方向(例えば、図2の35モード)のうちの1つを使用しうる。この構成にはいくつかの欠点がある。第1に、各PUについて、選択されたモードをデコーダへシグナルするために、選択されたモードのインデクスが、エンコードされたビデオ・ビットストリームでシグナルされる。どのイントラ予測が使用されるかは不確定性が高い(すなわち、35のモードがありうる)ので、インデクスをエンコードするために、比較的大きな数のビットが使用される。これは、圧縮されたビデオのビット・レートを増加させる。第2に、エンコーダは、使用するベストなモードを決定するために、または、少なくとも、例えばレート歪みしきい値のような要件を満たすモードを特定するために、すべてのモードをチェックする必要がありうる。各PUのために可能なすべてのイントラ予測モード/方向によって、このチェック・プロセスは、エンコーダにおける計算負荷を増やす。
本開示は、正方形SDIPパーティションおよび非正方形SDIPパーティションのために可能なイントラ予測モードの数を減少させることによって、エンコードされたビデオ・ビット・レートを低下させることと、エンコーダの複雑さを低減することと、のための技術を提案する。可能なイントラ予測モードの数のこのような減少は、垂直にパーティションされたCU(例えば、hNx2NのPU)の場合、垂直またはほぼ垂直なイントラ予測モード(例えば、モード1,22,23・・・)がベスト・モードとして選択される可能性がより高いという観察に基づく。同様に、水平にパーティションされたCU(例えば、2NxhNのPU)の場合、水平またはほぼ水平なイントラ予測モード(例えば、モード2,30,31・・・)がベスト・モードとして選択される可能性がより高い。すなわち、このようなモードは、選択される可能性がより高い。なぜなら、これらは、所与のパーティション・タイプのためのより好適なレート歪み結果をもたらす可能性がより高いからである。
図1は、本開示の例にしたがうイントラ予測コーディングのための技術を利用するように構成されうるビデオ・エンコーディングおよびデコーディング・システム10を例示するブロック図である。図1に図示されるように、システム10は、エンコードされたビデオを、通信チャンネル16を介して宛先デバイス14へ送信するソース・デバイス12を含んでいる。エンコードされたビデオ・データはまた、記憶媒体34またはファイル・サーバ36に格納され、所望される場合、宛先デバイス14によってアクセスされうる。記憶媒体またはファイル・サーバに格納された場合、ビデオ・エンコーダ20は、コーディングされたビデオ・データを記憶媒体に格納するために、コーディングされたビデオ・データを、例えばネットワーク・インタフェース、コンパクト・ディスク(CD)、ブルー・レイ、またはデジタル・ビデオ・ディスク(DVD)バーナ、またはスタンプ・ファシリティ・デバイスのような別のデバイス、または、その他のデバイスへ提供しうる。同様に、例えばネットワーク・インタフェース、CDまたはDVDリーダ等のようなビデオ・デコーダ30と分離されたデバイスが、コーディングされたビデオ・データを記憶媒体から検索し、検索したデータを、ビデオ・デコーダ30へ提供しうる。
ソース・デバイス12および宛先デバイス14は、デスクトップ・コンピュータ、ノートブック(すなわち、ラップトップ)コンピュータ、タブレット・コンピュータ、セット・トップ・ボックス、例えばいわゆるスマートフォンのような電話ハンドセット、テレビ、カメラ、ディスプレイ・デバイス、デジタル・メディア・プレーヤ、ビデオ・ゲーム・コンソール等を含む広範なさまざまなデバイスの何れかを備えうる。多くの場合、そのようなデバイスは、無線通信のために装備されうる。したがって、通信チャネル16は、無線チャネル、有線チャネル、または、エンコードされたビデオ・データの送信のために適した無線チャネルと有線チャネルとの組み合わせを備えうる。同様に、ファイル・サーバ36は、インターネット接続を含む任意の標準的なデータ接続によって、宛先デバイス14によってアクセスされうる。これは、無線チャネル(例えば、Wi−Fi接続)、有線接続(例えば、DSL、ケーブル・モデム等)、または、ファイル・サーバに格納された、エンコードされたビデオ・データにアクセスするために適切なこれら両方の組み合わせを含みうる。
イントラ予測コーディングのための技術は、本開示の例にしたがって、例えば、インターネットを経由したストリーミング・ビデオ送信、衛星テレビ送信、ケーブル・テレビ送信、オーバ・ザ・エア・テレビ・ブロードキャストのようなさまざまなマルチメディア・アプリケーションのいずれかをサポートするビデオ・コーディングや、データ記憶媒体における記憶のためのデジタル・ビデオのエンコードや、データ記憶媒体に格納されたデジタル・ビデオのデコードや、またはその他のアプリケーションに適用されうる。いくつかの例において、システム10は、例えばビデオ・ストリーミング、ビデオ再生、ビデオ・ブロードキャスト、および/または、ビデオ・テレフォニのようなアプリケーションをサポートする1方向または2方向のビデオ送信をサポートするように構成されうる。
図1の例では、ソース・デバイス12は、ビデオ・ソース18、ビデオ・エンコーダ20、変調器/復調器(モデム)22、および送信機24を含んでいる。ソース・デバイス12では、ビデオ・ソース18が、例えば、ビデオ・カメラ、以前にキャプチャされたビデオを含むビデオ・アーカイブ、ビデオ・コンテンツ・プロバイダからビデオを受信するためのビデオ・フィード・インタフェース、および/または、コンピュータ・グラフィック・データをソース・ビデオとして生成するコンピュータ・グラフィック・システム、または、このようなソースの組み合わせのようなビデオ・キャプチャ・デバイスのようなソースを含みうる。一例として、ビデオ・ソース18がビデオ・カメラであれば、ソース・デバイス12および宛先デバイス14は、いわゆるカメラ電話またはビデオ電話を形成しうる。しかしながら、本開示において記載されているこれら技術は、一般に、ビデオ・コーディングに適用可能でありうる。そして、無線または有線のアプリケーション、または、エンコードされたビデオ・データがローカル・ディスクに格納されるアプリケーションに適用されうる。
キャプチャされたビデオ、プリキャプチャされたビデオ、または、コンピュータによって生成されたビデオが、ビデオ・エンコーダ20によってエンコードされうる。エンコードされたビデオ情報は、例えば無線通信プロトコルのような通信規格にしたがってモデム22によって変調され、送信機24を介して宛先デバイス14へ送信されうる。モデム22は、さまざまなミキサ、フィルタ、増幅器、または信号変調のために設計されたその他の構成要素を含みうる。送信機24は、増幅器、フィルタ、および1または複数のアンテナを含む、データの送信のために設計された回路を含みうる。
ビデオ・エンコーダ20によってエンコードされた、キャプチャ、プレ・キャプチャ、または、コンピュータが生成したビデオはまた、その後の使用のために、記憶媒体34またはファイル・サーバ36に格納されうる。記憶媒体34は、ブルー・レイ・ディスク、DVD、CD−ROM、フラッシュ・メモリ、または、エンコードされたビデオを格納するためのその他任意の適切なデジタル記憶媒体を含みうる。記憶媒体34に格納されたエンコードされたビデオは、その後、デコードおよび再生のために、宛先デバイス14によってアクセスされうる。
ファイル・サーバ36は、エンコードされたビデオを格納し、このエンコードされたビデオを宛先デバイス14へ送信することが可能な任意のタイプのサーバでありうる。ファイル・サーバの例は、(例えば、ウェブサイトのための)ウェブ・サーバ、FTPサーバ、ネットワーク・アタッチ・ストレージ(NAS)デバイス、ローカル・ディスク・ドライブ、または、エンコードされたビデオ・データを格納することと、エンコードされたビデオ・データを宛先デバイスへ送信することとが可能なその他任意のタイプのデバイスを含む。ファイル・サーバ36からのエンコードされたビデオ・データの送信は、ストリーミング送信、ダウンロード送信、またはこれら両方の組み合わせでありうる。ファイル・サーバ36は、インターネット接続を含む任意の標準的なデータ接続によって宛先デバイス14によってアクセスされうる。これは、無線チャネル(例えば、Wi−Fi接続)、有線接続(例えば、DSL、ケーブル・モデム、イーサネット(登録商標)、USB等)、または、ファイル・サーバに格納された、エンコードされたビデオ・データにアクセスするために適切であるこれら両方の組み合わせを含みうる。
宛先デバイス14は、図1における例では、受信機26、モデム28、ビデオ・デコーダ30、およびディスプレイ・デバイス32を含んでいる。宛先デバイス14の受信機26は、チャネル16を介して情報を受信し、モデム28は、この情報を復調し、ビデオ・デコーダ30のための復調されたビット・ストリームを生成する。チャネル16を介して通信される情報は、ビデオ・データをデコードする際にビデオ・デコーダ30によって使用されるために、ビデオ・エンコーダ20によって生成されるさまざまなシンタックス情報を含みうる。そのようなシンタックスはまた、記憶媒体34またはファイル・サーバ36に格納された、エンコードされたビデオ・データとともに含まれうる。ビデオ・エンコーダ20およびビデオ・デコーダ30のおのおのは、ビデオ・データをエンコードまたはデコードすることが可能なそれぞれのエンコーダ−デコーダ(コーデック)の一部を形成しうる。
ディスプレイ・デバイス32は、宛先デバイス14と統合されるか、宛先デバイス14の外部でありうる。いくつかの例において、宛先デバイス14は、統合ディスプレイ装置を含みうる。そして、外部ディスプレイ・デバイスとインタフェースするようにも構成されうる。別の例において、宛先デバイス14は、ディスプレイ・デバイスでありうる。一般に、ディスプレイ・デバイス32は、デコードされたビデオ・データをユーザへ表示しうる。そして、例えば、液晶ディスプレイ(LCD)、プラズマ・ディスプレイ、有機発光ダイオード(OLED)ディスプレイ、またはその他のタイプのディスプレイ・デバイスのようなさまざまなディスプレイ・デバイスのうちの何かを備えうる。
図1の例では、通信チャネル16は、例えば、ラジオ周波数(RF)スペクトルまたは1または複数の物理送信ライン、または無線媒体と有線媒体との任意の組み合わせのような任意の無線媒体または有線媒体を備えうる。通信チャネル16は、例えば、ローカル・エリア・ネットワーク、広域ネットワーク、またはインターネットのようなグローバル・ネットワークといったパケット・ベースのネットワークの一部を形成しうる。通信チャネル16は、一般に、ソース・デバイス12から宛先デバイス14へビデオ・データを送信するために、有線媒体と無線媒体との任意の適切な組み合わせを含む、任意の適切な通信媒体、または別の通信媒体の集合を表す。通信チャネル16は、ルータ、スイッチ、基地局、または、ソース・デバイス12から宛先デバイス14への通信を容易にするために有用なその他任意の機器を含みうる。
ビデオ・エンコーダ20およびビデオ・デコーダ30は、例えば、現在開発中の高効率ビデオ・コーディング(HEVC)規格ようなビデオ圧縮規格にしたがって動作し、HEVCテスト・モデル(HM)に準拠しうる。あるいは、ビデオ・エンコーダ20およびビデオ・デコーダ30は、例えば、MPEG 4、パート10、アドバンスト・ビデオ・コーディング(AVC)とも称されるITU−T H.264規格のようなその他の独占規格または業界規格、または、これら規格の拡張にしたがって動作しうる。しかしながら、本開示の技術は、任意の特定のコーディング規格に限定されない。別の例は、MPEG2とITU−T H.263とを含んでいる。
図1に図示されていないが、いくつかの態様では、ビデオ・エンコーダ20およびビデオ・デコーダ30はおのおの、オーディオ・エンコーダおよびデコーダと統合されうる。そして、共通のデータ・ストリームまたは個別のデータ・ストリームにおいて、オーディオとビデオとの両方のエンコードを取り扱うために、適切なMUX−DEMUXユニット、またはその他のハードウェアおよびソフトウェアを含みうる。適用可能であれば、いくつかの例では、MUX−DEMUXユニットは、ITU H.223マルチプレクサ・プロトコル、または、例えばユーザ・データグラム・プロトコル(UDP)のようなその他のプロトコルに準拠しうる。
ビデオ・エンコーダ20およびビデオ・デコーダ30はおのおの、例えば1または複数のマイクロプロセッサ、デジタル信号プロセッサ(DSP)、特定用途向けIC(ASIC)、フィールド・プログラマブル・ゲート・アレイ(FPGA)、ディスクリート・ロジック、ソフトウェア、ハードウェア、ファームウェア、またはこれらの任意の組み合わせ、のようなさまざまな適切なエンコーダ回路のうちの何れかとして実現されうる。これら技術がソフトウェアで部分的に実施される場合、デバイスは、本開示の技術を実行するために、ソフトウェアのための命令群を、適切な非一時的なコンピュータ読取可能な媒体に格納し、これら命令群を、1または複数のプロセッサを用いてハードウェアで実行しうる。ビデオ・エンコーダ20およびビデオ・デコーダ30のおのおのは、1または複数のエンコーダまたはデコーダに含まれうる。これらの何れかは、それぞれのデバイスにおいて、結合されたビデオ・エンコーダ/デコーダ(コーデック)の一部として統合されうる。
ビデオ・エンコーダ20は、ビデオ・エンコード処理におけるイントラ予測コーディングのために本開示の技術のうちの何れかまたはすべてを実施しうる。同様に、ビデオ・デコーダ30は、ビデオ・コーディング処理において、イントラ予測コーディングのため、これら技術のうちの何れかまたはすべてを実施しうる。本開示に記載されているように、ビデオ・コーダは、ビデオ・エンコーダまたはビデオ・エンコーダを称しうる。同様に、ビデオ・コーディング・ユニットは、ビデオ・エンコーダまたはビデオ・デコーダを称しうる。同様に、ビデオ・コーディングは、ビデオ・エンコーディングまたはビデオ・デコーディングを称しうる。
以下にさらに詳細に記載される本開示の例によれば、ビデオ・エンコーダ20は、ビデオ・データのブロックのため、複数の予測ユニット・パーティションから、予測ユニット・パーティションを決定し、決定された予測ユニット・パーティションに基づいて、イントラ予測モードのセットを決定する、ように構成されうる。一例では、決定された予測ユニット・パーティションは、垂直方向の非正方形予測ユニット・パーティションであり、イントラ予測モードのセットは、垂直方向のイントラ予測モードを含む。別の例では、決定された予測ユニット・パーティションは、水平方向の非正方形予測ユニット・パーティションであり、イントラ予測モードのセットは、水平方向のイントラ予測モードを含む。
本開示の別の例では、ビデオ・エンコーダ20はさらに、ビデオ・データのブロックのため、イントラ予測モードのセットから、イントラ予測モードを決定し、決定されたイントラ予測モードに基づいて、ビデオ・データのブロックの変換ユニットパーティションを決定し、決定された変換ユニット・パーティションを用いて、ビデオ・データのブロックをエンコードする、ように構成されうる。
本開示の別の例では、ビデオ・エンコーダ20は、イントラ予測モードに基づいて、変換ユニット・パーティションのセットから、変換ユニット・パーティションを決定するように構成されうる。一例において、決定されたイントラ予測モードは、垂直方向のイントラ予測モードであり、変換ユニット・パーティションのセットは、垂直方向の非正方形変換ユニット・パーティションを含む。別の例では、決定されたイントラ予測モードは、水平方向のイントラ予測モードであり、変換ユニット・パーティションのセットは、水平方向の非正方形変換ユニット・パーティションを含む。さらなる別の例では、決定されたイントラ予測モードは、DCモード、平面モード、または対角モードであり、変換ユニット・パーティションのセットは、正方形変換ユニット・パーティションを含む。
本開示の別の例では、ビデオ・デコーダ30は、ビデオ・データのブロックの複数の予測ユニット・パーティションから、予測ユニット・パーティションを示すインジケーションを受信し、予測ユニット・パーティションに基づいて、イントラ予測モードのセットを決定する、ように構成されうる。一例では、予測ユニット・パーティションは、垂直方向の非正方形予測ユニット・パーティションであり、イントラ予測モードのセットは、垂直方向のイントラ予測モードを含む。別の例では、予測ユニット・パーティションは、水平方向の非正方形予測ユニット・パーティションであり、イントラ予測モードのセットは、水平方向のイントラ予測モードを含む。
本開示の別の例では、ビデオ・デコーダ30はさらに、ビデオ・データのブロックのため、イントラ予測モードのセットから、イントラ予測モードを示すインジケーションを受信し、決定されたイントラ予測モードに基づいて、ビデオ・データのブロックの変換ユニット・パーティションを決定し、決定された変換ユニット・パーティションを用いて、ビデオ・データのブロックをデコードする、ように構成されうる。
本開示の別の例では、ビデオ・デコーダ30は、イントラ予測モードに基づいて、変換ユニット・パーティションのセットから、変換ユニット・パーティションを決定するように構成されうる。一例において、決定されたイントラ予測モードは、垂直方向のイントラ予測モードであり、変換ユニット・パーティションのセットは、垂直方向の非正方形変換ユニット・パーティションを含む。別の例では、決定されたイントラ予測モードは、水平方向のイントラ予測モードであり、変換ユニット・パーティションのセットは、水平方向の非正方形変換ユニット・パーティションを含む。さらなる別の例では、決定されたイントラ予測モードは、DCモード、平面モード、または対角モードであり、変換ユニット・パーティションのセットは、正方形変換ユニット・パーティションを含む。
デジタル・ビデオ・デバイスは、デジタル・ビデオ情報をより効率的にエンコードおよびデコードするためのビデオ圧縮技術を実施する。ビデオ圧縮は、ビデオ・シーケンスにおける特有の冗長性を低減または除去するために、空間(イントラ・フレーム)予測および/または時間(インタ・フレーム)予測を適用しうる。
典型的なビデオ・エンコーダは、「ブロック」または「コーディング・ユニット」と呼ばれる連続的な長方形領域へ、オリジナルのビデオ・シーケンスの各フレームをパーティションする。これらのブロックは「イントラ・モード」(I−モード)で、または「インタ・モード」(P−モードまたはB−モード)でエンコードされる。
P−モードの場合、エンコーダは、先ず、Frefによって示される「基準フレーム」においてエンコードされているものに類似したブロックを求める探索を行う。探索は一般に、エンコードされるべきブロックからのある空間変位を超えないように制限される。ベスト・マッチ、すなわち「予測」が特定された場合、これは、2次元(2D)動きベクトル(Δx,Δy)の形式で表現される。ここで、Δxは水平方向の変位であり、Δyは垂直方向の変位である。動きベクトルは、基準フレームとともに、以下のような予測ブロックFpredを構築するために使用される。
pred(x,y)=Fref(x+Δx,y+Δy)
フレーム内のピクセルの位置は、(x、y)によって示される。I−モードでエンコードされたブロックの場合、予測ブロックは、同じフレーム内の以前にエンコードされた近隣ブロックからの空間予測を用いて形成される。I−モードと、P−モードまたはB−モードとの両方の場合、予測誤差、すなわち、エンコードされているブロックにおけるピクセル値と、予測ブロックにおけるピクセル値との間の差分は、例えば離散コサイン変換(DCT)のようないくつかの離散変換の重み基本関数のセットとして表されうる。変換は、例えば4x4、8x8、または16x16、およびそれより大きいような異なるサイズのブロックに基づいて実行されうる。変換ブロックの形状は、常に正方形であるとは限らない。例えば、16x4、32x8等の変換ブロック・サイズを用いて、長方形形状の変換ブロックもまた使用されうる。
次に、重み(すなわち、変換係数)が量子化される。量子化は、情報の損失をもたらす。よって、量子化された係数は、オリジナルの変換係数よりも低い精度しか有さない。ピクセルの輝度成分および彩度成分が個別に、予測され、量子化され、および変換されうる。すなわち、コーディング処理は、ピクセルの輝度成分のブロックのみならず、ピクセルの1または複数の彩度成分のブロックにも適用されうる。
量子化された変換係数および動きベクトルは、「シンタックス要素」の例である。いくつかの制御情報を加えられたこれらのシンタックス要素は、ビデオ・シーケンスのコーディング表示を形成する。シンタックス要素はさらに、エントロピ・コーディングされ、これによって、さらに、これらの表示のために必要なビット数が低減される。エントロピ・コーディングは、これら分布の特性(いくつかのシンボルは、他のシンボルよりもより頻繁に生じる)を利用することによって、(我々のケースのシンタックス要素において)送信または格納されたシンボルを表すために必要とされるビット数を最小化することを目的とされた無損失動作である。
デコーダでは、現在のフレームにおけるブロックは、先ず、エンコーダにおける場合と同じ方式で予測を構築することと、この予測を、圧縮された予測誤差に加えることと、によって取得されうる。圧縮された予測誤差は、ピクセル差分値を生成するために、量子化された係数を用いて変換基本関数を重み付けることによって発見される。再構築されたフレームとオリジナルのフレームとの間の差分は、再構築誤差と呼ばれる。
圧縮比、すなわち、オリジナルのシーケンスと圧縮されたシーケンスとを表すために使用されるビット数の比は、変換係数を量子化する場合に使用される量子化パラメータ(QP)の値を調節することによって制御されうる。圧縮比は、適用されているエントロピ・コーディングの方法に依存しうる。
新たなビデオ・コーディング規格、すなわち、高効率ビデオ・コーディング(HEVC)がある。これは、ITU−T ビデオ・コーディング・エキスパート・グループ(VCEG)およびISO/IECモーション・ピクチャ・エキスパート・グループ(MPEG)のビデオ・コーディング(JCT−VC)におけるジョイント・コラボレーション・チームによって開発されている。“HEVCワーキング・ドラフト7”または“WD7”と称されるHEVC規格の最近のドラフトは、ITU−T SG16 WP3およびISO/IEC JTC1/SC29/WG11のビデオ・コーディング(JCT−VC)におけるジョイント・コラボレーティブ・チーム、第9回ミーティング、ジュネーブ、スイス、2012年4月27日−5月7日における「高効率ビデオ・コーディング(HEVC)テキスト仕様ドラフト7」(High efficiency video coding (HEVC) text specification draft 7)と題されたBrossらによるドキュメントJCTVC−I1003、に記載されている。これは、2012年8月21日時点で、http://phenix.int- evry.fr/jct/doc_end_user/documents/ 9_Geneva/wg11/JCTVC-I1003-v6.zipからダウンロード可能である。
一例として、JCT−VCによって現在開発中のHEVC規格にしたがうビデオ・コーディングの場合、ビデオ・フレームは、コーディング・ユニットにパーティションされうる。コーディング・ユニット(CU)は、一般に、さまざまなコーディング・ツールがビデオ圧縮のために適用される基本ユニットとして作用する画像領域を称する。CUは、通常、Yとして示される輝度成分と、UおよびVとして示される2つの彩度成分とを有する。ビデオ・サンプリング・フォーマットに依存して、U成分とV成分のサイズは、サンプル数の観点において、Y成分のサイズと同じであるか、または、異なりうる。CUは一般に正方形であり、例えば、ITU−T H.264のようなその他のビデオ・コーディング規格の下では、いわゆるマクロブロックに類似していると考えられうる。
より良好なコーディング効率を達成するために、コーディング・ユニットは、ビデオ・コンテンツに依存する可変サイズを有しうる。さらに、CUは、予測または変換のために、より小さなブロックへ分割されうる。特に、各CUはさらに、予測ユニット(PU)および変換ユニット(TU)へパーティションされうる。PUは、例えばH.254のようなその他のビデオ・コーディング規格におけるいわゆるパーティションに類似していると考えられうる。変換ユニット(TU)は、変換係数を生成するために変換が適用される残余データのブロックを称する。
開発中のHEVC規格の現在提案されている態様のいくつかにしたがうコーディングは、例示の目的のために本明細書において記載される。しかしながら、本開示に記載された技術は、例えば、ITU−T H.264またはその他の規格または専用のビデオ・コーディング処理にしたがって定義されたようなその他のビデオ・コーディング処理のために有用でありうる。
HEVC規格化作業は、HEVCテスト・モデル(HM)と称されたビデオ・コーディング・デバイスのモデルに基づく。HMは、例えばITU−T H.264/AVCにしたがうデバイスに対するビデオ・コーディング・デバイスのいくつかの機能を推定する。例えば、H.264は、9つのイントラ予測エンコード・モードを提供するが、HMは、35ものイントラ予測エンコード・モードを提供する。
HEVCにおける35のイントラ予測モードは、1つのDCモード、1つの平面モード、および33の異なる方向予測モードを含んでいる。方向予測モードを用いて、予測は、モードによって示されるある方向に沿って構築された近隣ブロックのピクセルに基づいて実行される。異なる予測モードに関連付けられた方向(0−34)が、図2に示される。
HMによれば、CUは、1または複数のPUおよび/または1または複数のTUを含みうる。ビットストリーム内のシンタックス・データは、ピクセル数の点から最大のCUである最大コーディング・ユニット(LCU)を定義しうる。一般に、CUは、CUがサイズ区別を有していないこと以外は、H.264のマクロブロックと同じ目的を有する。したがって、CUは、サブCUへ分割されうる。一般に、CUへの本開示における参照は、ピクチャの最大コーディング・ユニットまたはLCUのサブCUを称しうる。LCUはサブCUへ分割され、各サブCUはさらに、サブCUへ分割されうる。ビットストリームのシンタックス・データは、CUデプスと称される、LCUが分割されうる最大回数を定義しうる。したがって、ビットストリームはまた、最小コーディング・ユニット(SCU)を定義しうる。本開示はまた、CU、PU、またはTUのうちの何れかを称するために、「ブロック」、「パーティション」、または「部分」という用語を使用する。一般に、「部分」は、ビデオ・フレームの任意のサブ・セットを称しうる。
LCUは、クワッド・ツリー・データ構造に関連付けられうる。一般に、クワッド・ツリー・データ構造は、CU当たり1つのノードを含む。ここで、ルート・ノードは、LCUに相当する。CUが4つのサブCUへ分割されるのであれば、CUに対応するノードは、4つのリーフ・ノードを含んでいる。これらのおのおのは、サブCUのうちの1つに対応する。クワッド・ツリー・データ構造の各ノードは、対応するCUのためのシンタックス・データを提供しうる。例えば、クワッド・ツリーにおけるノードは、分割フラグを含みうる。これは、このノードに対応するCUが、サブCUに分割されるか否かを示す。CUのためのシンタックス要素は、再帰的に定義されうる。そして、CUがサブCUに分割されるか否かに依存しうる。CUは、さらに分割されないのであれば、リーフCUと称される。
さらに、リーフCUのTUもまた、それぞれのクワッド・ツリー・データ構造に関連付けられうる。すなわち、リーフCUは、リーフCUがどうやってTUへパーティションされるのかを示すクワッド・ツリーを含みうる。本開示は、LCUがどのようにCUクワッド・ツリーとしてパーティションされるのかを示すクワッド・ツリーと、リーフCUがどのようにTUクワッド・ツリーとしてTUへパーティションされるのかを示すクワッド・ツリーとを参照する。TUクワッド・ツリーのルート・ノードは、一般に、リーフCUに対応する一方、CUクワッド・ツリーのルート・ノードは、一般に、LCUに対応する。分割されないTUクワッド・ツリーのTUは、リーフTUと称される。
リーフCUは、1または複数の予測ユニット(PU)を含みうる。一般に、PUは、対応するCUのすべてまたは一部を表し、PUの基準サンプルを検索するためのデータを含みうる。例えば、PUがインタ・モード・エンコードされた場合、PUは、PUのための動きベクトルを定義するデータを含みうる。動きベクトルを定義するデータは、例えば、動きベクトルの水平成分、動きベクトルの垂直成分、動きベクトルの解像度(例えば、整数ピクセル精度、4分の1ピクセル精度、または8分の1ピクセル精度)、動きベクトルが指す基準フレーム、および/または、動きベクトルのための参照リスト(例えば、リスト0またはリスト1)を記述しうる。PU(単数または複数)を定義するリーフCUのためのデータはさらに、1または複数のPUへのCUのパーティショニングをも記述しうる。モードをパーティションすることは、CUが予測的にコーディングされていないか、イントラ予測モードでエンコードされていないか、または、インタ予測モードでエンコードされていないかに依存して異なりうる。イントラ・コーディングの場合、PUは、後述するリーフ変換ユニットと同じように取り扱われうる。
HEVCはさらに、クワッド・ツリー・スタイル変換ユニット・パーティション構造を許容する。図3に図示されるように、例えば、外部ブロックは、オリジナルのCUである。内部ブロックは、クワッド・ツリー構造にしたがう、変換ブロック分解の結果を表す。もちろん、そのような結果は、多くの可能な分解からの単なる1つである。図3の例では、3つのレベルの変換分解が存在する。レベル−1分解では、変換ブロックの全体が、4つの4分の1サイズのブロックへ分割される。次に、レベル−2では、第2の4分の1サイズの変換ブロック(右上)がさらに、4つの16分の1サイズの変換ブロックへ分割される。その後、レベル−3では、第4の16分の1サイズの変換ブロックがさらに、さらに小さな4つの変換ブロックに分割される。レベル−0における変換ユニットは、全体のコーディング・ユニットが、さらなる分割無しでともに変換されることを意味する。この場合、変換ユニットは、同じサイズのコーディング・ユニットを有する。実際、変換ユニットがさらに分割されるか否かが、レート歪み最適化に基づいて決定される。
HEVCのための1つの提案では、(例えば、図3に示されるような)正方形形状の変換ユニットに加えて、非正方形形状のTUもまた使用されうる。図4Aのブロック1は、垂直方向の非正方形変換パーティションの例の概念図である。例えば、サイズ2Nx2Nのインタ予測ブロックの場合、ブロック1において示されるように、0.5Nx2Nのサイズの4つの変換ブロック(変換ユニットとも呼ばれうる)が使用されうる。そのような変換は、2Nx2NのPUパーティションとともに使用されうるか、または、PUパーティションがブロック2,3,または4の形式である場合に使用されうる。ブロック2は、2つのパーティションに分離された2Nx2NのPUであり、これらおのおのは、オリジナルのブロック・サイズの半分のサイズを有する。ブロック2におけるパーティションはしばしばNx2Nパーティションと呼ばれる。ブロック3および4のPUは、それぞれ、オリジナルのブロック・サイズの1/4および3/4のサイズを持つ2つのパーティションに分離される。ブロック3の左パーティションはしばしば0.5Nx2Nパーティションと呼ばれる一方、ブロック3の右パーティションはしばしば1.5Nx2Nパーティションと呼ばれる。同様に、ブロック4の左パーティションはしばしば1.5Nx2Nパーティションと呼ばれる一方、ブロック4の右パーティションはしばしば0.5Nx2Nパーティションと呼ばれる。
図4Aでは、PUのパーティションが垂直方向を向いている。図4Bに図示されるように、PUのパーティションが水平方向を向いている場合、同様のTUパーティショニングが使用されうる。図4Bのブロック5は、水平方向の非正方形変換パーティションの例の概念図である。例えば、サイズ2Nx2Nのインタ予測ブロックの場合、ブロック5に図示されるように、2Nx0.5Nのサイズにおける(変換ユニットとも呼ばれる)4つの変換ブロックが使用されうる。そのような変換は、2Nx2NのPUパーティションを用いて使用されうるか、または、PUパーティションがブロック6,7または8の形式である場合に使用されうる。ブロック6は、2つのパーティションへ分離された2Nx2NのPUであり、これらおのおのは、オリジナルのブロック・サイズの半分のサイズを有する。ブロック6におけるパーティションは、しばしば、2NxNパーティションと呼ばれる。ブロック7および8のPUは、それぞれ、オリジナルのブロック・サイズの1/4および3/4のサイズを持つ2つのパーティションに分離される。ブロック7の上パーティションはしばしば2Nx0.5Nパーティションと呼ばれる一方、ブロック7の下パーティションはしばしば2Nx1.5Nパーティションと呼ばれる。同様に、ブロック8の上パーティションはしばしば2Nx1.5Nパーティションと呼ばれる一方、ブロック8の下パーティションはしばしば2x0.5Nパーティションと呼ばれる。
インタ予測ブロックのためのHEVCによれば、現在のブロックのパーティション・モードに依存して非正方形変換が使用されることが理解されうる。図4Aのブロック2,3,および4に図示されるように、垂直方向にPUがパーティションされているのであれば、垂直方向の変換ブロックが使用されうる。図4Bのブロック6,7,および8に図示されるように、PUが、水平方向にパーティションされているのであれば、水平方向の変換ブロックが使用されうる。
インタ予測ブロックとは逆に、HEVCの以前の提案だけが、イントラ予測ブロックのための正方形形状のTUを許容する。さらに、TUの形状およびサイズは、イントラ予測ブロックのために使用されるPUの形状およびサイズと揃えられる。イントラ予測ブロックのTUとPUの例が図5Aに示される。ブロック11は、4つの4分の1サイズのパーティションへパーティションされる。ブロック13では、第2の4分の1サイズのパーティション(右上)がさらに、オリジナルのブロック・サイズの1/16のサイズを持つ、より小さな4うつパーティションにパーティションされる。HEVCのための初期の提案に基づいて、図5Aにおいて図示されるブロックはそれぞれ、個別に予測され、変換され、再構築される。TUサイズは、各ケースにおけるPUサイズと同じである。
HEVCにおける最近の提案は、イントラ予測ブロックにおける非正方形変換の使用を要求する。図5Bは、イントラ予測ブロックのために使用されうる非正方形TUおよびPUの例を図示する。図5Bの例では、PUは、長方形形状をも有しうる。繰り返すが、TUは、PUと揃えられ、同じサイズおよび形状を有する。ブロック15は、垂直方向の長方形形状を有するTUおよびPUを図示し、ブロック17は、水平方向の長方形形状を有するTUおよびPUを図示する。各パーティションは、再構築されたピクセルの近隣ブロックから、1つずつ予測される(イントラ予測を用いて予測される)。ここでは、予測のために使用されるPUと同じサイズのTUを用いて、予測残余が変換される。
図5Bに図示される非正方形のTUおよびPUの例が、図5Aの正方形形状のTUおよびPUに加えて使用されうる。言い換えれば、所与のブロックのために、図5Aと図5Bとの両方において例示されているケースが許容される。例えば、クワッド・ツリー分解レベル−1では、ブロック11に図示される変換パーティションが選択されうる。別の場合には、ブロック15または17において図示される変換パーティションが選択されうる。エンコーダ側では、図5Aおよび図5Bに図示されるものを含む、許容可能なすべてのPUパーティションとTUパーティションとがテストされ、最も最適なレート歪みメトリックを示す(または、予期されたレート歪みしきい値を満足する)パーティション・モードが決定され、最良のパーティション・モードが、エンコードされたビットストリームでシグナルされる。テストは、正方形形状の変換に加えて、非正方形形状の変換をイネーブルすることが、イントラ予測ブロックのためのコーディング効率を改善しうることを示している。
イントラ予測ブロックの場合、TUがPUとともにカップルされるので、ユニークな各TUパーティションが、ユニークなPUパーティションとマッチすると、ブロック内のTUパーティションの異なるオプションをチェックすることは、複数の予測および再構築を実行することを含みうる。その結果、エンコーディング複雑さは、追加の非正方形パーティションがチェックされシグナルされると、著しく高くなる。この高いエンコーダ複雑さは、いくつかの状況において、イントラ予測ブロックをコーディングするための正方形変換に加えて、非正方形変換を使用することを非現実的にする。これらの欠点を考慮して、現在の開示は、コーディング効率を維持しながら、イントラ予測ブロックのための非正方形変換を、低減された複雑さでイネーブルするための技術を提案する。
本開示は、これらの欠点に対処するためのいくつかの技術を示す。一例として、所与のイントラ予測ブロックの場合、いくつかの条件に基づいて、低減された数の変換ユニット・パーティション・オプションが許容される。別の例において、本開示は、イントラ予測ブロックのため、PUサイズおよび形状から、TUサイズおよび形状をデカップルすることを提案する。すなわち、所与のPUのために、PUとは異なるサイズおよび形状のTUが適用されうる。その結果、異なるTUパーティションをチェックすることは、すべての状況において、ブロックの対応する予測を個別に取得することを必要としない。
本開示の1つの例によれば、イントラ予測ブロックの場合、低減された数のTUパーティション・オプションが、対応するPUのために使用されるイントラ予測方向(または、イントラ予測モード)に基づいて許容される。例えば、PUが、例えばイントラ予測モード0のように、垂直方向から予測されることを現在のPUのイントラ予測モードが示すのであれば、垂直方向の非正方形変換(例えば、図5Bのブロック15におけるTUパーティション)のみが許容される。垂直方向のイントラ予測モードを用いて予測されるPUのためには、正方形形状変換は許容されない。さらに、水平方向の非正方形TU(例えば、図5Bのブロック17におけるTUパーティション)も許容されない。一般に、この制限は、例えばモード0,21,22,11,および12のように、主として垂直方向であるすべてのイントラ予測方向に適用されうる。モード0,21,22,11,および12は、垂直方向のイントラ予測モードの単なる例である。別の例において、追加のイントラ予測モードは、垂直方向であるとして分類されうる。
同様に、本開示の別の例によれば、現在のPUのイントラ予測モードが、例えば、イントラ予測モード1のように水平方向からPUが予測されることを示すのであれば、水平方向の非正方形のTU(例えば、図5Bのブロック17におけるTUパーティション)のみが許容される。水平方向のイントラ予測モードを用いて予測されたPUについて、正方形形状の変換は許容されない。さらに、垂直方向の非正方形のTU(例えば、図5Bのブロック15におけるTUパーティション)も許容されない。一般に、この制限は、例えばモード1,29,30,15,および16のように、主として水平方向であるすべてのイントラ予測方向に適用されうる。モード1,29,30,15,および16は単に、水平方向のイントラ予測モードの例である。別の例では、追加のイントラ予測モードは、水平方向であるとして分類されうる。
本開示の別の例では、現在のPUのイントラ予測モードが、例えばDCモード2または平面モード34のような任意の明らかな方向優先度を有していないのであれば、正方形形状のTUのみが、ブロックのために許容される。一般に、この制限は、水平方向でも垂直方向でもないすべてのイントラ予測方向に適用されうる。例えば、正方形形状のTUへの制限はまた、例えばモード3,18,および26のように、主として対角方向であるこれらイントラ予測方向に適用されうる。モード3,18,および26は、対角方向のイントラ予測モードの単なる例である。他の例では、さらなるイントラ予測モードが、対角方向であるとして分類されうる。
図2に図示されたように、具体的に前述されていないその他のイントラ予測モードは、許容可能なTUパーティションのタイプに関する制限はない。例えば、正方形TUパーティション、非正方形垂直方向TUパーティション、および非正方形水平方向TUパーティションが許容されうる。
前述したイントラ予測モード・ベースのTUパーティション制限(すなわち、各イントラ予測モードに対するあるTUパーティションの制限)は、モード決定ステージ(すなわち、イントラ予測モードを選択する)においてなされうるか、または、エンコード処理全体(すなわち、モード決定ステージとエントロピ・コーディング・ステージとの両方)のために使用されうる。
モード決定ステージ(例えば、図7のモード選択ユニット40)は、エンコーダが、可能なTUパーティションをテストし、ビット・レート/歪み基準に基づいたものを選択するステージを称する。TU制限が、モード決定ステージにおいてのみ適用されるのであれば、ビデオ・エンコーダ20は、選択されたイントラ予測モードのために許容されている、選択されたTU(これは、可能なすべてのTUのサブセットでありうる)のみをテストする。エントロピ・コーディング・ステージ(例えば、図7のエントロピ・コーディング・ユニット56)では、ビデオ・エンコーダ20は、シグナリングのために利用可能であるように、選択されたイントラ予測のために許容されたサブセットのみではなく、可能なすべてのTUを考慮する。例えば、合計3つの可能なTUパーティション(例えば、垂直方向(パーティションA)、水平方向(パーティションB)、および正方形(パーティションC))があると仮定する。イントラ・モードkの場合、モード決定ステージにおいて、変換Aのみが考慮することを許容されていると仮定する。しかしながら、エントロピ・コーディング・ステージでは、ビデオ・エンコーダ20は、パーティションA、B、Cのすべてが利用可能であり、したがって、これらすべての可能性を考慮して、パーティションAの選択をシグナルする。例えば、ビデオ・エンコーダ20は、パーティションCが選択されていることを示すために、square_tranform_flag=1をシグナルしうるか、または、非正方形変換(すなわち、AまたはB)を示すためにsquare_transform_flag=0を、変換Aまたは変換Bのどちらが選択されているのかを示すために、transform_dir_flag=1(または0)をシグナルしうる。シンタックス要素transform_dir_flag=1は、水平方向TUに対応する一方、transform_dir_flag=0は、垂直方向TUに対応しうる。また、その逆もありうる。
エンコード処理全体に対してTUパーティション制限を適用することは、
利用可能な変換の制限が、(前述したような)モード選択ステージのみならず、エントロピ・コーディング・ステージとの両方に適用されることを意味する。エントロピ・コーディング・ステージでは、TUパーティション選択がシグナルされる場合、選択されたイントラ予測モードのために許容された変換のみが考慮される。例えば、イントラ・モードkの場合、変換Aおよび変換Cのみが許容される(Bは許容されない)のであれば、ビデオ・エンコーダ20は、1つのフラグ(Aが選択された場合、flag=1、Cが選択された場合、flag=0)をシグナルする。別の例では、モードkの場合、変換Aしか許容されていないのであれば、変換は、デコーダにおいて、イントラ・モードから推論されうるので、ビデオ・エンコーダ20は、どのフラグも送信する必要がないだろう。
本開示の1つの例によれば、使用することが可能なTUパーティション(単数または複数)は、ビデオ・エンコーダ20において使用するために選択されたイントラ予測モードに依存する。この例では、各イントラ予測モードについて、1つのみのTUパーティションが指定される。利用可能なTUパーティションのタイプは、正方形TUパーティション、垂直方向の非正方形TUパーティション、および水平方向の非正方形TUパーティションを含みうる。
イントラ予測モードとTUパーティションの間の依存性は、例えば、メモリに格納されたマッピング・テーブルの形態で、または、実装されている式または規則のセットとして、ビデオ・エンコーダ20とビデオ・デコーダ30との両方で利用可能とされうる。その結果、この例では、使用されているTUパーティションのタイプを、エンコーダからデコーダへとシグナルする必要はない。その代わり、ビデオ・デコーダ30では、PUまたはブロックのイントラ予測モードがデコードされると、その依存するTUパーティションが、エンコーダにおける場合と同じ方式で、すなわち、イントラ予測モードに基づいて、マッピング・テーブルまたは規則から決定されうる。
本開示の別の例によれば、選択されたTUパーティションは、未だに、選択された現在のブロック/PUのイントラ予測モードに依存するが、各予測方向について、指定され許容されている1または複数のTUパーティションが存在しうる。エンコードされたビデオ・ビットストリームにおいて、選択されたイントラ予測モードをシグナルすることに加えて、あるイントラ予測モードのために指定された1つより多くのTUパーティションが存在する場合、選択されたイントラ予測モードのために指定されたどのTUパーティションが使用されるべきであるかを示すために、追加のビットまたはフラグもシグナルされる。例えば、垂直予測方向(例えば、モード0)の場合、垂直方向の非正方形TUパーティションまたは正方形TUパーティションの何れかが使用されうる。水平予測方向(例えば、モード1)の場合、水平方向の非正方形TUパーティションまたは正方形TUパーティションの何れかが使用されうる。
このコンテキストでは、エンコードされたビットストリームでTUパーティションをシグナルすることは、このような要素の、エンコーダからデコーダへのリアル・タイム送信を必要としないが、このようなシンタックス要素がビットストリームにエンコードされ、何れかの方式でデコーダへアクセス可能とされることを意味する。これは、(例えば、ビデオ会議における)リアル・タイム送信のみならず、デコーダによる将来の使用のため、エンコードされたビットストリームを、コンピュータ読取可能な媒体(例えば、ストリーミング、ダウンロード、ディスク・アクセス・カード・アクセス、DVD,ブルー・レイ等)に格納することを含みうる。
イントラ予測モードの場合、指定されたTUパーティションが1つしかないのであれば、このようなイントラ予測モードが使用されている場合、TUパーティションを示すために、エンコーダからデコーダへ追加のビットまたはフラグをシグナルする必要はない。代わりに、関連付けられたTUパーティションは、エンコーダとデコーダとの両方で推論されうる。例えば、DCモードまたは平面モードの下では、正方形TUパーティションだけが、使用のために利用可能とされうる。繰り返すが、イントラ予測モード、許容されたTUパーティションの数、および許容されたTUパーティションのタイプとの間の依存性ば、例えば、メモリに格納されたマッピング・テーブルの形態で、または、実装されている式または規則のセットとして、エンコーダとデコーダとの両方で利用可能とされうる。
本開示のさらに別の例によれば、選択されたTUパーティションは未だに、現在のブロックのイントラ予測モードに依存するが、各イントラ予測方向について、指定および許容された同じ数のTUパーティションが存在する。例えば、各予測モードについて、指定および許容された2つのTUパーティションがある。
そのようにする動機は、例えばCABACのようなエントロピ・コーダが使用されている場合、第2の例のスキームに関連付けられた解析問題を避けることである。前述した第2の例によれば、イントラ予測モードに依存して、変換パーティションを示す追加のビットまたはフラグを送信する必要がある場合も、ない場合もありうる。ビデオ・デコーダ30では、現在のブロックについて、追加の1ビットまたはフラグを解析するか否かを知るために、ブロックのイントラ予測モードが十分にデコードされる必要がある。CABACのようなエントロピ・コーダが使用される場合、これは、デコーダにおける問題を引き起こしうる。
すべてのイントラ予測モードが、同じ数の指定されたTUパーティション(例えば、2つのTUパーティション)を有する例では、どのイントラ予測モードが選択されているかに関わらず、ブロック/PUのために使用されているTUパーティションを示すために、1つの追加のビットまたはフラグがシグナルされる。このように、フラグの追加のビットが常に送信されるであろうから、この追加のビットまたはフラグのデコーダ側における解析は、ブロックの実際のイントラ予測モードに依存しない。
本開示の別の例によれば、イントラ予測ブロックの場合、TUはもはや、サイズおよび/または形状の観点からPUにカップルされていない。言い換えれば、TUは、対応するPUとは異なるサイズおよび/または形状を有しうる。例えば、図6に図示されるように、2Nx2Nのパーティショニング・モードを有するイントラ予測ブロックのPU19は、CUと同じサイズを有しうる。NxNパーティショニング・モードのイントラ予測ブロックのPU21の各パーティションは、CUサイズの4分の1のサイズを有しうる。
各PUについて、PUのためにどのTUパーティションが使用されるべきであるかに関わらず、再構築されたピクセルの近隣ブロックを用いて、イントラ予測が先ず実行される。予測残余がPUのために利用可能となると、PU内のTUパーティションがさらに決定され、シグナルされうる。
そのような技術では、TUとPUはもはやカップリングされないので、特定のPUのためのTUパーティションがどれであるかに関わらず、予測残余は不変のままである。その結果、エンコーダ側では、予測および予測残余を毎回再計算することなく、別のTUパーティションがテストされうる。そのため、エンコーダ複雑さが低減されうる。
例えば、図6のPU19のパーティションを使用する場合、CU全体の予測方向が最初に取得される。その後、CU全体の残余が計算される。次に、この予測残余に基づいて、図4Aおよび図4Bにおいて図示されるような異なるTUパーティションがテストされ、最良のものが、エンコードされたビデオ・ビットストリームでシグナルされる。
本開示のさらに別の例によれば、イントラ予測ブロックについて、TUはPUとカップルされない。言い換えれば、TUは、対応するPUとは異なるサイズまたは形状を有しうる。しかしながら、選択されたイントラ予測モードに依存して、低減された数のTUパーティションが許容されうる。
例えば、所与のイントラ予測モードの場合、いくつかのTUパーティションが、最も最適なレート歪みメトリックとなる可能性は極めて低くなりうる。この場合、所与のイントラ予測モードのために使用される可能性の低いTUパーティションを取り除くことによって、許容されたpTUパーティションの数を減少させることは、TUパーティションのシグナリング・オーバヘッドを減少させ、コーディング効率を向上しうる。
所与のイントラ予測モードのために利用可能なTUパーティションの1より多くのオプションが存在する場合、現在のブロック/PUの最良のTUパーティションのインデクスが、エンコードされたビデオ・ビットストリームでシグナルされる。例えば、特定のイントラ予測モードのために利用可能な3つのオプションのTUパーティションが存在する場合、0,1,または2のインデクス値がシグナルされ、ブロック/PUのためにそれぞれどのTUパーティションが選択されたのかが示される。
そのようなインデクス値をシグナルする際におけるコーディング効率を改善するために、現在のブロックのイントラ予測モードが、コンテキストとして使用されうる。TUパーティションのインデクス値をシグナルする際に、イントラ予測モードに依存して、適応性コーディング(例えば、CABAC)において使用される異なる確率モデルが使用されうる。すなわち、所与のイントラ予測モードの場合、最良のレート歪みメトリックを有するより高い確率を有すると示されているTUパーティションが、より高い確率を考慮する確率モデルを備えたCABACを用いてコーディングされるだろう。本開示の別の例によれば、現在のブロックの近隣ブロックのために使用されているTUパーティションのインデクス値が、現在のブロックのための変換ユニット・パーティションのインデクス値をコーディングする際におけるコンテキストとして使用されうる。
本開示の別の例にしたがって、非正方形PUをシグナルするための技術が記載される。特に、本開示は、非正方形短距離イントラ予測パーティションのためのイントラ・モード・セットを減少させることによって、エンコードされたビデオ・ビット・レートを減少させ、エンコーダ複雑さを低減する、ための技術を記載している。
前述したように、HEVC,H264、およびその他のビデオ・コーディング規格における以前のブロック・ベースのイントラ・コーディングは、再構築ユニットおよび予測ユニットとして、1つのNxN正方形ブロックを使用する。正方形ブロック内部のピクセルは、近隣の再構築されたブロックの境界から予測される。これは、正方形ブロックの右底部分におけるピクセルについて、シーケンスのいくつかの領域におけるその他の部分とは異なり、最適ではない予測をもたらすという結果になりうる。より良い空間相関性を得るために、HEVC規格における使用のために、短距離イントラ予測(SDIP)コーディング・スキームが最近提案されている。SDIP技術は、1つのNxN正方形ブロックを、長方形形状を持つ非正方形ブロックまたはいくつかのラインにパーティションすること含む。ブロックでは、ライン毎に、または、長方形毎に、ピクセルが予測され再構築される。したがって、予測距離は短くされる。
SDIPの1つの例では、32x32より小さい1つのNxN正方形ブロックが、非正方形の長方形形状を持つ非正方形ブロックまたはピクセルのいくつかのラインに分割される。ブロックでは、ライン毎に、または、長方形毎に、ピクセルが予測され再構築される。
SDIPの別の例では、64x64より小さい1つのCUは、長方形形状を備えた非正方形ブロックまたはラインとして分割されうる。例えば、32x32のCUは、4つの8x32のPUまたは4つの32x8のPUとしてパーティションされうる。別の例では、16x16のCUは、4つの8x8のPUに分割されうるのみならず、4つの4x16/16x4のPUにも分割され、4x16/16x4のPUはさらに、4つの1x16/16x1のパーティションへ分割されうる。同様に、1つの8x8のCUは4つの2x8/8x2のPUにも分割され、各4x4のPUはさらに、4つの1x4/4x1のパーティションに分割されうる。
より一般的に言えば、2Nx2NサイズのイントラCUの場合、HEVCで以前に使用されていた2つのPUサイズ、すなわち2Nx2NおよびNxN(現在、NxNは、最小のCUレベルにおいてのみ許容されている)が存在する。例えば、図5には、2Nx2NパーティションおよびNxNパーティションが示されている。2Nx2Nパーティション19の場合、CU全体で、(サイズ2Nx2Nの)1つのPUしか有していない。SDIPを導入すると、新たに2つの予測ユニット、2NxhNおよびhNx2Nが追加される。2NxhNパーティションの場合、CUは4つの2NxhNのPUを有し、hNx2Nの場合、CUは4つのhNx2NのPUを有している。各PUは、自身のイントラ予測モード(すなわち、図2に示されるような35モードのうちの1つ)を有する。図4Bのブロック17は、2NxhNのPUパーティションの例を示す。図4Bのブロック15は、hNx2NのPUパーティションの例を示す。
例えば、SDIPを用いて非正方形PUを用いた場合、各PUは、複数のイントラ予測モード/方向(例えば、図2の35モード)のうちの1つを使用しうる。この構成にはいくつかの欠点がある。第1に、各PUについて、選択されたモードをデコーダへシグナルするために、選択されたモードのインデクスが、エンコードされたビデオ・ビットストリームでシグナルされる。どのモードが使用されるかの不確定性が高い(すなわち、35のモードがありうる)ので、インデクスをエンコードするために、比較的大きな数のビットが使用される。これは、圧縮されたビデオのビット・レートを増加させる。第2に、エンコーダは、使用するベストなものを決定するために、または、少なくとも、例えばレート歪みしきい値のような要件を満たすモードを特定するために、すべてのモードをチェックする必要がありうる。各PUのために許容されているすべてのイントラ予測モード/方向によって、このチェック・プロセスは、エンコーダにおける計算負荷を増やす。
本開示は、正方形SDIPパーティションおよび非正方形SDIPパーティションのための可能なイントラ予測モードの数を低減することによって、エンコードされたビデオ・ビット・レートを低下させ、エンコーダの複雑さを低減する、ための技術を提案する。可能なイントラ予測モードの数のこのような低減は、垂直にパーティションされたCU(例えば、hNx2NのPU)の場合、垂直またはほぼ垂直のイントラ予測モード(例えば、モード1,22,23・・・)がベスト・モードとして選択される可能性がより高いという観察に基づく。同様に、水平にパーティションされたCU(例えば、2NxhNのPU)の場合、水平またはほぼ水平のイントラ予測モード(例えば、モード2,30,31・・・)がベスト・モードとして選択される可能性がより高い。
本開示では、SDIPパーティション依存のイントラ予測モード・セットが提案される。(例えば、2NxhNパーティションおよびhHx2Nパーティションのような)SDIP PUパーティションのイントラ予測モード・セットは、(例えば、2Nx2NパーティションおよびNxNパーティションのような)正方形PUパーティションのために使用されるイントラ予測モード・セットとは異なりうる。例えば、SDIP PUパーティションのイントラ予測モード・セットは、正方形PUパーティションのために利用可能なモードの総数(例えば、図2の35モード)のサブセットでありうる。言い換えれば、SDIP PUパーティションのイントラ予測モード・セットは、正方形PUパーティションのために使用されるイントラ予測モード・セットよりも少ないモードを含みうる。さらに、イントラ予測モード・セットは、SDIPパーティション方向に依存しうる。例えば、垂直方向にパーティションされたhNx2Nパーティションと、水平方向にパーティションされた2NxhNパーティションとは、異なるイントラ予測モード・セットを有しうる。
いくつかのSDIPパーティションについて、所与のセットにおけるイントラ予測モードの数を低減することによって、選択されたイントラ予測モードをエンコードするために使用されるコードワードは、より短くなるので、ビットが節約され、ビット・レートが低減されうる。さらに、SDIPパーティションのためにより少数のイントラ予測モードしかチェックされないので、エンコード処理における計算負荷が低減され、エンコーディングが加速されうる。イントラ予測モード・セットを、SDIPパーティション方向に依存させることによって、35のイントラ予測モードの十分な補足によって提供されるエンコード利得のほとんどは、選択されたイントラ予測モード候補(すなわち、低減されたイントラ予測モード・セット)で維持されうることが期待される。
本開示の1つの例では、hNx2NのPUパーティションの場合、イントラ予測モード・セットは、イントラ予測モード0,21,22,11,および12を含む垂直またはほぼ垂直なイントラ予測モードを含みうるが、その他のイントラ予測モード(例えば、水平またはほぼ水平なモード、DCモード、平面モード、およびその他の角度モード)を除外する。2NxhNのPUの場合、イントラ予測モード・セットは、モード1,29,30,15,および16を含む水平またはほぼ水平なイントラ予測モードを含みうるが、その他のイントラ予測モード(例えば、垂直またはほぼ垂直なモード、DCモード、平面モード、およびその他の角度モード)を除外する。
本開示の別の例では、hNx2NのPUパーティションの場合、イントラ予測モードは、垂直またはほぼ垂直なイントラ予測モードのみならず、強い方向性を持たないその他のモード(例えば、DCモードおよび/または平面モード)を含みうるが、その他のイントラ予測モード(例えば、水平またはほぼ水平なモードおよびその他の角度モード)を除外する。強い方向性を有するモードは、垂直またはほぼ垂直であるモードと、水平またはほぼ水平であるモードである。2NxhNのPUパーティションの場合、イントラ予測モードは、水平またはほぼ水平なイントラ予測モードのみならず、強い方向性を持たないその他のモード(例えば、DCモードおよび/または平面モード)を含みうるが、その他のイントラ予測モード(例えば、垂直またはほぼ垂直なモードおよびその他の角度モード)を除外する。
本開示の別の例では、hNx2NのPUパーティションの場合、イントラ予測モード・セットは、これら垂直なイントラ・モードまたはほぼ垂直なイントラ・モードと、強い方向性を有さないその他のモード(例えば、DCモードおよび/または平面モード)と、いくつかの水平なモードまたはほぼ水平なモード(例えば、モード2)とを含みうる。このイントラ・モード・セットにおけるモードの総数は、正方形パーティションのためのモードの総数(例えば、全部で35モード)よりも少なくなりうる。2NxhNのPUパーティションの場合、イントラ予測モード・セットは、これら水平なイントラ・モードまたはほぼ水平なイントラ・モードと、強い方向性を有さないその他のモード(例えば、DCモードおよび/または平面モード)と、いくつかの垂直なモードまたはほぼ垂直なモード(例えば、モード1)とを含みうる。このイントラ・モード・セットにおけるモードの総数は、正方形パーティションのためのモードの総数よりも少なくなりうる(例えば、全部で35のモードを含むセットよりも小さくなりうる)。
本開示はまた、CUサイズにも依存する特定のPUパーティションのためのイントラ予測モード・セットを利用可能にする技術をも提案する。例えば、hNx2NのSDIP PUパーティションを有する32x32のCUは、hNx2NのSDIP PUパーティションを有する16x16のCUとは異なるイントラ・モード・セットを有しうる。この例において、(hNx2NのSDIP PUパーティションを有する)32x32のCUの場合、イントラ・モード・セットは、モード0,21,および22を含み、(hNx2NのSDIP PUパーティションを有する)16x16のCUの場合、イントラ・モード・セットは、モード0,21,22,11,12,および23を含む。さらに、イントラ予測モード・セットはまた、ピクチャ・タイプのように、その他のサイド情報にも依存しうる。例えば、イントラ・スライス/ピクチャの場合、hNx2NのSDIP PUパーティションを有するCUのイントラ予測モード・セットは、モード0,21,22,11,12,および23を含んでいる。PスライスまたはBスライスの場合、hNx2NのSDIP PUパーティションを有するCUのイントラ予測モード・セットは、35モードをすべて含んでいる。
いくつかの例において、SDIPパーティションのためのイントラ予測モード・セットは、固定セットでありうる。そして、ビデオ・エンコーダ20とビデオ・デコーダ30との両方において格納されうる。別の例では、イントラ予測モード・セットはまた、いくつかの高レベル・シンタックスを用いて、エンコードされたビットストリームでシグナルされうる。例えば、そのようなシンタックスは、SPS(シーケンス・パラメータ・セット)および/またはPPS(ピクチャ・パラメータ・セット)でシグナルされうる。
本開示の別の例では、エントロピ・コーディングが、より簡単かつ効率的になるように、SDIPイントラ予測モード・セットにおけるモードが、(例えば、ゼロから始まって連続的に)リナンバされうる。例えば、hNx2Nのパーティションのためのイントラ予測モード・セットが、3つのモード、(図2に図示されるように)0,21,および22を含む。モード0,21,および22は、エントロピ・コーディングのために、0,1,および2としてリナンバされうる(例えば、0−>0,21−>1,および22−>2)。ビデオ・デコーダ30では、正しい方向でのイントラ予測が実行されるように、リナンバされたイントラ予測モードが、オリジナルのモード番号(この例では、0,21,および22)にリマップされうる。
最も可能性の高いモード(MPM)は、イントラ予測モードをシグナルするために使用されうる。HMソフトウェアの1つのバージョンでは、2つのMPMがある。1つのMPMは、先頭PU(すなわち、現在のPUの直接上にあるPU)モードであり、その他のMPMは、左PU(すなわち、現在のPUの直接左にあるPU)モードである。現在のPUのモードが、MPM PUのうちの1つのモードと同じである場合、フラグは、エンコードされたビデオ・ビットストリームにおいてシグナルされる。もしもそれが正しければ、どのMPMが現在のPUのモードとマッチするのかを示すために、別のフラグが、エンコードされたビデオ・ストリームでシグナルされるだろう。MPMシグナリング技術を使用することは、PUのために選択されたイントラ予測モードをシグナルするために必要なビットの量を低減する。
本開示で提案されるように、2つのSDIP PU(すなわち、hNx2Nと2NxhN)と正方形PUとは、異なるイントラ予測モード・セットを有しうる。これは、MPMベースのイントラ予測モード・シグナリングにおけるいくつかの問題および/または非効率を引き起こしうる。例えば、左PUと先頭PUとが、現在のPUのものとは異なるイントラ予測モード・セットを有するのであれば、左および先頭のPUから導出されるMPMは、現在のPUに利用可能ないずれのイントラ予測モードとも異なる。したがって、MPMコーディングは、有用では無くなる。
この欠点を考慮して、本開示はさらに、PU AおよびPU Bのためのイントラ予測モード・セットが異なるケースにおいては、PU(A)のモードが、別のPU(B)のMPMとして使用される場合、モード・マッピング/量子化を実行することを提案する。S(A)を、PU(A)のイントラ予測モード・セットとして、m(A)を、PU(A)のために使用されるモードとして定義する。同様に、S(B)を、PU(B)のイントラ予測モード・セットとして、m(B)を、PU(B)のために使用されるモードとして定義する。マッピングは、m(A)を、S(B)におけるモードYにマップするように実行され、Yは、m(B)をエンコードするためにMPMとして使用される。ビデオ・エンコーダ20は、このフォワード・マッピングを実行しうる。さらに、ビデオ・デコーダ30も、オリジナルのイントラ予測モードを取得するために、フォワード・マッピングを実行しうる。
1つの例において、Yは、m(A)と最も類似の方向を有するS(B)におけるモードとして定義される。別の例では、S(A)におけるモードの、S(B)におけるモードへのマッピングが固定され、エンコーダとデコーダとの両方において利用可能である。別の例では、S(A)におけるモードの、S(B)におけるモードへのマッピングがエンコーダによって定義され、(例えば、SPSまたはPPSにおいて)いくつかの高レベル・シンタックスを用いて送信される。すなわち、マッピングは、マッピング・アルゴリズムにしたがって、エンコーダにおいて実行され、マッピングを実行するために使用されるアルゴリズム(または、アルゴリズムのためのインデクス)は、エンコードされたビット・ストリームでシグナルされる。別の例では、S(A)におけるモードの、S(B)におけるモードへのマッピングは、サイド情報(例えば、CU/PUサイズ、ピクチャ・タイプ等)に依存しうる。
図7は、本開示において記載されたようなTUおよびPU選択およびシグナリングのための技術を使用しうるビデオ・エンコーダ20の例を例示するブロック図である。ビデオ・エンコーダ20は、例示目的のためであり、変換係数のコーディングを必要とする方法またはその他のコーディング規格に関して本開示を限定することなく、HEVCコーディングのコンテキストにおいて記載されるだろう。ビデオ・エンコーダ20は、ビデオ・フレーム内のCUのイントラ・コーディングおよびインタ・コーディングを実行しうる。イントラ・コーディングは、所与のビデオ・フレーム内のビデオ・データにおける空間冗長性を低減または除去するために、空間予測に依存する。インタ・コーディングは、ビデオ・シーケンスの現在のフレームと以前にコーディングされたビデオとの間における時間冗長性を低減または除去するために、時間予測に依存する。イントラ・モード(I−モード)は、いくつかの空間ベースのビデオ圧縮モードのうちの何れかを称しうる。例えば、単一方向予測(P−モード)または双方向予測(B−モード)のようなインタ・モードは、いくつかの時間ベースのビデオ圧縮モードの何れかを称しうる。
図7に図示されるように、ビデオ・エンコーダ20は、エンコードされるべきビデオ・フレーム内の現在のビデオ・ブロックを受信する。図7の例では、ビデオ・エンコーダ20は、動き補償ユニット44、動き推定ユニット42、イントラ予測モジュール46、基準フレーム・バッファ64、加算器50、変換モジュール52、量子化ユニット54、およびエントロピ・エンコーディング・ユニット56を含んでいる。ビデオ・ブロック再構築のために、ビデオ・エンコーダ20はまた、逆量子化ユニット58、逆変換ユニット・モジュール60、および加算器62を含んでいる。再構築されたビデオからのブロックネス(blockiness)アーチファクトを除去するために、ブロック境界をフィルタするデブロッキング・フィルタまたはその他のイン・ループ・フィルタ(図7に図示せず)もまた含まれうる。所望されるのであれば、デブロッキング・フィルタは、一般には、加算器62の出力をフィルタするであろう。
モード選択ユニット40は、例えば、各モードのレート歪み分析に基づいて、イントラまたはインタであるコーディング・モードのうちの1つを選択しうる。そして、結果として得られたイントラ予測ブロックまたはインタ予測ブロック(例えば、予測ユニット(PU))を、残余ブロック・データを生成するために加算器50に提供し、基準フレームにおいて使用するためのエンコードされたブロックを再構築するために加算器62に提供する。加算器62は、以下にさらに記載されるように、エンコードされたブロックを再構築するために、ブロックについて逆変換モジュール60からの、逆変換され、逆量子化されたデータと、予測ブロックとを結合する。いくつかのビデオ・フレームは、I−フレームとして指定される。ここでは、I−フレームにおけるすべてのブロックが、イントラ予測モードでエンコードされる。いくつかの場合には、イントラ予測モジュール46が、例えば、動き推定ユニット42による動き探索がブロックの十分な予測という結果をもたらさない場合、P−フレームまたはB−フレームのブロックのイントラ予測エンコードを実行しうる。
エンコード処理中、ビデオ・エンコーダ20は、コーディングされるべきビデオ・フレームまたはスライスを受信する。フレームまたはスライスは、例えば、最大コーディング・ユニット(LCU)のような複数のビデオ・ブロックに分割されうる。動き推定ユニット42および動き補償ユニット44は、時間圧縮を与えるために、1または複数の基準フレームにおける1または複数のブロックに対する、受信されたビデオ・ブロックのインタ予測コーディングを実行する。イントラ予測モジュール46は、同じフレームまたはスライスにおける1または複数の近隣ブロックに対する、受信されたビデオ・ブロックのイントラ予測コーディングを、空間圧縮を提供するためにコーディングされるべきブロックとして実行しうる。
動き推定ユニット42および動き補償ユニット44は、高度に統合されうるが、概念的な目的のために、個別に例示されている。動き推定(または、動き探索)は、ビデオ・ブロックの動きを推定する動きベクトルを生成する処理である。動きベクトルは、例えば、基準フレームの基準サンプルに対する現在のフレームにおける予測ユニットの変位を示しうる。動き推定ユニット42は、予測ユニットを、基準フレーム・バッファ64に格納された基準フレームの基準サンプルと比較することによって、インタ・コードされたフレームの予測ユニットの動きベクトルを計算する。基準サンプルは、ピクセル差分に関してコーディングされたPUを含むCUの一部と緊密にマッチすることが判明したブロックでありうる。ピクセル差分は、絶対差分(SAD)の合計、平方差分(SSD)の合計、または、その他の差分メトリックによって決定されうる。基準サンプルは、基準フレームまたは基準スライス内のどこでもありうる。そして、必ずしも、基準フレームまたは基準スライスのブロック(例えば、コーディング・ユニット)境界にあるとは限らない。いくつかの例では、基準サンプルは、断片的なピクセル位置にありうる。
動き推定ユニット42は、計算された動きベクトルを、エントロピ・エンコーディング・ユニット56および動き補償ユニット44に送る。動きベクトルによって識別された基準フレームの部分は、基準サンプルと称されうる。動き補償ユニット44は、例えば、PUのために動きベクトルによって特定された基準サンプルを検索することによって、現在のCUの予測ユニットのための予測値を計算しうる。
イントラ予測モジュール46は、動き推定ユニット42および動き補償ユニット44によって実行されるインタ予測に対する代替として、受信されたブロックに対してイントラ予測を実行しうる。イントラ予測モジュール46は、左から右、上から下へのブロックのエンコード順を仮定して、近隣の、以前にコーディングされたブロック、例えば、現在のブロックの上、右上、左上、または左のブロックに対して、受信されたブロックを予測しうる。イントラ予測モジュール46は、異なるさまざまなイントラ予測モードのうちの1つにしたがってイントラ予測を実行するように構成されうる。例えば、イントラ予測モジュール46は、例えば、エンコードされているCUのサイズに基づいて、例えば35の方向予測モードのようなある数の方向予測モードを設定されうる。
イントラ予測モジュール46は、例えば、さまざまなイントラ予測モードの誤差値を計算することと、最小誤差値をもたらすモードを選択することとによって、イントラ予測モードを選択しうる。方向予測モードは、空間的な近隣ピクセルの値を結合し、結合された値を、PU内の1または複数のピクセル位置に適用するための機能を含みうる。PU内のすべてのピクセル位置の値が計算されると、PUのための予測ブロックが取得され、イントラ予測モジュール46が、予測ブロックと、エンコードされるべき受信ブロックとの間のピクセル差分に基づいて、予測モードの誤差値を計算しうる。イントラ予測モジュール46は、許容可能な誤差値を生成するイントラ予測モードが発見されるまで、イントラ予測モードのテストを継続しうる。イントラ予測モジュール46はその後、予測ブロックを加算器50に送信しうる。
ビデオ・エンコーダ20は、コーディングされているオリジナルのビデオ・ブロックから、動き補償ユニット44またはイントラ予測モジュール46によって計算された予測データを引くことにより、残余ビデオ・ブロックを生成する。加算器50は、この減算演算を実行する構成要素(単数または複数)を表す。残余ブロックは、ピクセル差分値の2次元行列に対応しうる。ここでは、残余ブロックにおける値の数は、残余ブロックに対応する予測ブロックにおけるピクセルの数と同一である。残余ブロックにおける値は、コーディングされるべきオリジナルのブロックおよび予測ブロックにおいてコロケートされたピクセルの値の差分、すなわち、誤差に対応しうる。この差分は、コーディングされるブロックのタイプに依存する輝度差分または彩度差分でありうる。
変換モジュール52は、残余ブロックから、1または複数のTUを生成しうる。変換モジュール52は、複数の変換の中から、変換を選択する。この変換は、例えばブロック・サイズ、コーディング・モード等のような1または複数のコーディング特性に基づいて選択されうる。変換モジュール52はその後、選択された変換をTUに適用し、変換係数の2次元配列を備えるビデオ・ブロックを生成する。変換モジュール52は、本開示の前述した技術にしたがって変換パーティションを選択しうる。さらに、変換モジュール52は、選択された変換パーティションを、エンコードされたビデオ・ビットストリームでシグナルしうる。
変換モジュール52は、結果として得られた変換係数を量子化ユニット54へ送信しうる。量子化ユニット54は、その後、変換係数を量子化しうる。エントロピ・エンコーディング・ユニット56は、その後、スキャン・モードにしたがって、この行列において、量子化された変換係数のスキャンを実行しうる。本開示は、このスキャンを実行するものとして、エントロピ・エンコード・ユニット56を記載している。しかしながら、その他の例では、例えば量子化ユニット54のようなその他の処理ユニットがスキャンを実行しうることが理解されるべきである。
変換係数が1次元配列にスキャンされると、エントロピ・エンコード・ユニット56は、例えば、CAVLC、CABAC,シンタックス・ベースのコンテキスト適応バイナリ演算コーディング(SBAC)、またはその他のエントロピ・コーディング方法のようなエントロピ・コーディングを係数に適用しうる。
CAVLCを実行するために、エントロピ・エンコード・ユニット56は、送信されるべきシンボルのために可変長コードを選択しうる。VLCにおけるコードワードは、比較的短いコードが、より可能性の高いシンボルに対応し、より長いコードが、より可能性の低いシンボルに対応するように構築されうる。このように、VLCを用いることで、例えば、送信されるべき各シンボルのために等しい長さのコードワードを用いることに対するビット節約を達成しうる。
CABACを実行するために、エントロピ・エンコード・ユニット56は、送信されるべきシンボルをエンコードするためにあるコンテキストへ適用するためのコンテキスト・モデルを選択しうる。このコンテキストは、例えば、近隣の値が、非ゼロであるか否かに関連しうる。エントロピ・エンコード・ユニット56はまた、例えば、選択された変換を示す信号のようなエントロピ・エンコード・シンタックス要素でもありうる。本開示の技術にしたがって、エントロピ・エンコード・ユニット56は、例えば、イントラ予測モードのイントラ予測方向、シンタックス要素に対応する係数のスキャン位置、ブロック・タイプ、および/または、変換タイプに基づいて、コンテキスト・モデル選択のために使用されているその他の要因の中から、これらシンタックス要素をエンコードするために使用されるコンテキスト・モデルを選択しうる。
結果として得られたエンコードされたビデオは、エントロピ・エンコーディング・ユニット56によるエントロピ・コーディング後、例えばビデオ・デコーダ30のような別のデバイスへ送信されうるか、または、後の送信または検索のためにアーカイブされうる。
いくつかのケースでは、エントロピ・エンコーディング・ユニット56またはビデオ・エンコーダ20のその他のユニットは、エントロピ・コーディングに加えて、その他のコーディング機能を実行するように構成されうる。例えば、エントロピ・エンコード・ユニット56は、CUおよびPUのためのコーディング・ブロック・パターン(CBP)を決定するように構成されうる。さらに、いくつかのケースでは、エントロピ・エンコード・ユニット56は、係数のラン・レングス・コーディングを実行しうる。
逆量子化ユニット58および逆変換モジュール60は、例えば、基準ブロックとして後に使用するために、逆量子化または逆変換をそれぞれ適用し、ピクセル領域内の残余ブロックを再構築しうる。動き補償ユニット44は、残余ブロックを、基準フレーム・バッファ64のフレームのうちの1つの予測ブロックへ加えることによって、基準ブロックを計算しうる。動き補償ユニット44はまた、動き推定において使用するためのサブ整数ピクセル値を計算するために、1または複数の補間フィルタを、再構築された残余ブロックに適用しうる。加算器62は、動き補償ユニット44によって生成された動き補償予測ブロックに、再構築された残余ブロックを加え、基準フレーム・バッファ64に格納するために、再構築されたビデオ・ブロックが生成される。基準フレーム・バッファ64は、しばしば、デコード・ピクチャ・バッファ(DPB)と呼ばれる。再構築されたビデオ・ブロックは、その後のビデオ・フレームにおけるブロックをインタ・コーディングするために、動き推定ユニット42および動き補償ユニット44によって、基準ブロックとして使用されうる。
図8は、エンコードされたビデオ・シーケンスをデコードするビデオ・デコーダ30の例を例示するブロック図である。図8の例では、ビデオ・デコーダ30は、エントロピ・デコード・ユニット70、動き補償ユニット72、イントラ予測モジュール74、逆量子化ユニット76、逆変換ユニット78、基準フレーム・バッファ82、および加算器80を含む。ビデオ・デコーダ30は、いくつかの例において、ビデオ・エンコーダ20(図7参照)に関して記載されたエンコード・パスに一般に逆であるデコード・パスを実行しうる。
エントロピ・デコード・ユニット70は、変換係数の1次元配列を検索するために、エンコードされたビットストリームに対して、エントロピ・デコード処理を実行する。使用されるエントロピ・デコード・プロセスは、ビデオ・エンコーダ20によって使用されるエントロピ・コーディング(例えばCABAC、CAVLC等)に依存する。エンコーダによって使用されるエントロピ・コーディング処理は、エンコードされたビットストリームでシグナルされうるか、または、予め決定された処理でありうる。
いくつかの例において、エントロピ・デコード・ユニット70(または、逆量子化ユニット76)は、ビデオ・エンコーダ20のエントロピ・エンコード・ユニット56(または、量子化ユニット54)によって使用されるスキャン・モードをミラーするスキャンを用いて、受信値をスキャンしうる。係数のスキャンは、逆量子化ユニット76において実行されうるが、スキャンは、エントロピ・デコード・ユニット70によって実行されるものとして、例示目的のために記載されるだろう。さらに、例示の容易のために、個別の機能ユニットとして図示されているが、エントロピ・デコード・ユニット70、逆量子化ユニット76、およびビデオ・デコーダ30のその他のユニットの構成および機能は、互いに高度に統合されうる。
逆量子化ユニット76は、ビットストリームで提供され、エントロピ・デコード・ユニット70によってデコードされた、量子化された変換係数を逆量子化、すなわちde quantizeする。逆量子化処理は、例えば、HEVCのために提案された処理に類似した、または、H.264デコード規格によって定義されたような従来の処理を含みうる。逆量子化処理は、量子化の程度、また同様に、適用されねばならない逆量子化の程度を決定するために、CUについてビデオ・エンコーダ20によって計算された量子化パラメータQPを使用することをも含みうる。逆量子化ユニット76は、係数が1次元配列から2次元配列へ変換される前、または、変換された後かの何れかにおいて、変換係数を逆量子化しうる。
逆変換モジュール78は、逆量子化された変換係数に、逆変換を適用する。いくつかの例では、逆変換モジュール78は、ビデオ・エンコーダ20からのシグナリングに基づいて、または、例えばブロック・サイズ、コーディング・モード等のような1または複数のコーディング特性から変換を推論することによって、逆変換を決定しうる。いくつかの例では、逆変換モジュール78は、現在のブロックを含むLCUのためのクワッド・ツリーのルート・ノードにおいてシグナルされた変換に基づいて、現在のブロックへ適用するための変換を決定しうる。あるいは、変換は、LCUクワッド・ツリーにおけるリーフ・ノードCUのために、TUクワッド・ツリーのルートにおいてシグナルされうる。いくつかの例では、逆変換モジュール78は、カスケード逆変換を適用する。ここでは、逆変換モジュール78が、デコードされている現在のブロックの変換係数へ、2またはそれ以上の逆変換を適用する。
さらに、逆変換モジュール74は、本開示の前述した技術にしたがって、変換ユニット・パーティションを生成するために、逆変換を適用しうる。すなわち、逆変換モジュール74は、本開示の技術にしたがってシグナルされるような正方形または非正方形のTUパーティションへ変換を適用しうる。
イントラ予測モジュール74は、現在のフレームの以前にデコードされたブロックからのデータおよびシグナルされたイントラ予測モードに基づいて、現在のフレームの現在のブロックのための予測データを生成しうる。
検索された動き予測方向、基準フレーム・インデクス、および計算された現在の動きベクトルに基づいて、動き補償ユニットは、現在の部分の動き補償ブロックを生成する。これら動き補償ブロックは本質的に、残余データを生成するために使用される予測ブロックを再生成する。
動き補償ユニット72は、動き補償ブロックを生成し、恐らくは、補間フィルタに基づいて、補間を実行する。サブ・ピクセルの精度を持つ動き推定のために使用されるべき補間フィルタのためのアイデンティファイヤが、シンタックス要素に含まれうる。動き補償ユニット72は、基準ブロックのサブ整数ピクセルについて、補間された値を計算するために、ビデオ・ブロックのエンコード中、ビデオ・エンコーダ20によって使用されるような補間フィルタを使用しうる。動き補償ユニット72は、受信されたシンタックス情報にしたがって、ビデオ・エンコーダ20によって使用される補間フィルタを決定しうる。そして、予測ブロックを生成するために、この補間フィルタを使用しうる。
さらに、動き補償ユニット72およびイントラ予測モジュール74は、HEVCの例では、エンコードされたビデオ・シーケンスのフレーム(単数または複数)をエンコードするために使用されるLCUのサイズを決定するために、(例えば、クワッド・ツリーによって提供される)シンタックス情報のいくつかを使用しうる。動き補償ユニット72およびイントラ予測モジュール74はまた、エンコードされたビデオ・シーケンスのフレームの各CUがどのようにして分離されているのか(および、同様に、サブCUがどのようにして分離されているのか)を記載する分離情報を決定するためにも、シンタックス情報を使用しうる。特に、イントラ予測モジュール74は、本開示で前述されたように、非正方形のSDIP PUパーティションに対してイントラ予測を実行するために、低減された数のイントラ予測モードを使用しうる。シンタックス情報はまた、各分離がどのようにしてエンコードされているのかを示すモード(例えば、イントラまたはインタ予測、および、イントラ予測のためのイントラ予測エンコード・モード)と、インタ・エンコードされた各PUのための1または複数の基準フレーム(および/または、基準フレームのための識別子を含む基準リスト)と、エンコードされたビデオ・シーケンスをデコードするためのその他の情報とを含みうる。
加算器80は、デコードされたブロックを生成するために、残余ブロックを、動き補償ユニット72またはイントラ予測ユニットによって生成された対応する予測ブロックと加算する。所望されるのであれば、ブロッキネス(blockiness)アーティファクトを除去するために、デブロッキング・フィルタも適用され、デコードされたブロックがフィルタされる。デコードされたビデオ・ブロックはその後、基準フレーム・バッファ82に格納される。これは、その後の動き補償のため基準ブロックを提供し、さらに、(例えば、図1のディスプレイ・デバイス32のような)ディスプレイ・デバイス上で表示するために、デコードされたビデオを生成する。
図9は、本開示の例にしたがうビデオ・エンコード方法の例を図示するフローチャートである。図9の方法は、ビデオ・エンコーダ20の1または複数の構成によって実行されうる。
先ず、オプションのステップとして、ビデオ・エンコーダ20は、ビデオ・データのブロックの複数の予測ユニット・パーティションから、予測ユニット(PU)パーティションを決定し(920)、決定された予測ユニット・パーティションに基づいて、イントラ予測モードのセットを決定しうる(922)。
1つの例では、決定された予測ユニット・パーティションは、垂直方向の非正方形の予測ユニット・パーティションであり、イントラ予測モードのセットは、垂直方向のイントラ予測モードを含む。別の例において、決定された予測ユニット・パーティションは、水平方向の非正方形の予測ユニット・パーティションであり、イントラ予測モードのセットは、水平方向のイントラ予測モードを含む。
ビデオ・エンコーダ20はさらに、ビデオ・データのブロックのため、イントラ予測モードのセットから、イントラ予測モードを決定し(924)、決定されたイントラ予測モードに基づいて、ビデオ・データのブロックのための変換ユニット(TU)パーティションを決定し(926)、決定された変換ユニット・パーティションを用いて、ビデオ・データのブロックをエンコードする(928)ように構成されうる。その後、ビデオ・エンコーダ20は、決定された変換パーティションを、エンコードされたビデオ・ビットストリームでシグナルするように構成されうる(930)。
一例において、ビデオ・データのブロックは、予測ユニットであり、予測ユニット・パーティションは、決定された変換ユニット・パーティションと同じサイズおよび形状を有する。別の例では、ビデオ・データのブロックは、予測ユニットであり、予測ユニット・パーティションは、決定された変換ユニットとは異なるサイズおよび形状を有する。
本開示の別の例では、ビデオ・エンコーダ20は、イントラ予測モードに基づいて、変換ユニット・パーティションのセットから、変換ユニット・パーティションを決定するように構成されうる。一例では、決定されたイントラ予測モードは、垂直方向のイントラ予測モードであり、変換ユニット・パーティションのセットは、垂直方向の非正方形の変換ユニット・パーティションを含む。別の例では、決定されたイントラ予測モードは、水平方向のイントラ予測モードであり、変換ユニット・パーティションのセットは、水平方向の非正方形の変換ユニット・パーティションを含む。また別の例では、決定されたイントラ予測モードは、DCモード、平面モード、または対角モードであり、変換ユニット・パーティションのセットは、正方形の変換ユニット・パーティションを含む。
変換ユニット・パーティションのセットは、可変数のパーティションを有しうる。一例では、変換ユニット・パーティションのセットは、イントラ予測モード毎に1つの変換ユニット・パーティションしか含まない。別の例では、等しい数の変換ユニット・パーティションが、複数のイントラ予測モードのおのおのの変換ユニット・パーティションの各セットにおいて存在する。
本開示の別の例では、変換ユニット・パーティションを決定すること(926)は、予測残余を生成するために、決定されたイントラ予測モードにしたがって、ビデオ・データのブロックにおいて、イントラ予測を実行することと、予測残余における複数の変換パーティションをテストすることと、このテストに基づいて、複数の変換パーティションのうちの1つを選択することと、を含みうる。
図10は、本開示の例にしたがうビデオ・デコード方法の例を図示するフローチャートである。図10の方法は、ビデオ・デコーダ30の1または複数の構成によって実行されうる。
先ず、オプションのステップとして、ビデオ・デコーダ30は、ビデオ・データのブロックのため、複数の予測ユニット・パーティションから、予測ユニット(PU)パーティションを示すインジケーションを受信し(1020)、予測ユニット・パーティションに基づいて、イントラ予測モードのセットを決定する(1022)ように構成されうる。
一例では、予測ユニット・パーティションは、垂直方向の非正方形の予測ユニット・パーティションであり、イントラ予測モードのセットは、垂直方向のイントラ予測モードを含む。別の例では、予測ユニット・パーティションは、水平方向の非正方形の予測ユニット・パーティションであり、イントラ予測モードのセットは、水平方向のイントラ予測モードを含む。
ビデオ・デコーダ30はさらに、ビデオ・データのブロックのため、イントラ予測モードのセットから、イントラ予測モードを示すインジケーションを受信し(1024)、決定されたイントラ予測モードに基づいて、ビデオ・データのブロックのための変換ユニット・パーティションを決定し(1026)、決定された変換ユニット・パーティションを用いて、ビデオ・データのブロックをデコードする(1028)ように構成されうる。
一例では、ビデオ・データのブロックは、予測ユニットであり、予測ユニット・パーティションは、決定された変換ユニット・パーティションと同じサイズおよび形状を有する。別の例では、ビデオ・データのブロックは、予測ユニットであり、予測ユニット・パーティションは、決定された変換ユニットとは異なるサイズおよび形状を有する。
本開示の別の例では、ビデオ・デコーダ30は、イントラ予測モードに基づいて、変換ユニット・パーティションのセットから、変換ユニット・パーティションを決定するように構成されうる。一例では、決定されたイントラ予測モードは、水平方向のイントラ予測モードであり、変換ユニット・パーティションのセットは、垂直方向の非正方形の変換ユニット・パーティションを含む。別の例では、決定されたイントラ予測モードは、水平方向のイントラ予測モードであり、変換ユニット・パーティションのセットは、水平方向の非正方形の変換ユニット・パーティションを含む。また別の例では、決定されたイントラ予測モードは、DCモード、平面モード、または対角モードであり、変換ユニット・パーティションのセットは、正方形の変換ユニット・パーティションを含む。
変換ユニット・パーティションのセットは、可変数のパーティションを有しうる。一例では、変換ユニット・パーティションのセットは、イントラ予測モード毎に1つの変換ユニット・パーティションしか含まない。別の例では、等しい数の変換ユニット・パーティションが、複数のイントラ予測モードのおのおのの変換ユニット・パーティションの各セットに存在する。
1または複数の例において、記述された機能は、ハードウェア、ソフトウェア、ファームウェア、またはこれらの任意の組み合わせで実現されうる。ソフトウェアで実現されるのであれば、これら機能は、コンピュータ読取可能な媒体におけるコードまたは1または複数の命令群で送信されるか格納され、ハードウェア・ベースの処理ユニットによって実行されうる。コンピュータ読取可能な媒体は、コンピュータ読取可能な記憶媒体を含みうる。これは、例えばデータ記憶媒体のような有形の媒体、または、例えば通信プロトコルにしたがって、1つの場所から別の場所へのコンピュータ・プログラムの転送を容易にする任意の媒体を含む通信媒体に相当する。このように、コンピュータ読取可能な媒体は、一般に、(1)非一時的である有形のコンピュータ読取可能な記憶媒体、または、(2)例えば信号または搬送波のような通信媒体に対応しうる。データ記憶媒体は、本開示において記述された技術を実施するための命令群、コード、および/または、データ構造を検索するために1または複数のコンピュータまたは1または複数のプロセッサによってアクセスされうる任意の利用可能な媒体でありうる。コンピュータ・プログラム製品は、コンピュータ読取可能な媒体を含みうる。
例として、限定することなく、このようなコンピュータ読取可能な記憶媒体は、RAM、ROM、EEPROM、CD−ROMまたはその他の光ディスク記憶装置、磁気ディスク記憶装置またはその他の磁気記憶デバイス、フラッシュ・デバイス、あるいは、所望のプログラム・コード手段を命令群またはデータ構造の形式で搬送または格納するために使用され、しかも、コンピュータによってアクセスされうるその他任意の媒体を備えうる。さらに、いかなる接続も、コンピュータ読取可能な媒体として適切に称される。同軸ケーブル、光ファイバ・ケーブル、ツイスト・ペア、デジタル加入者線(DSL)、あるいは、例えば赤外線、無線およびマイクロ波のような無線技術を使用して、ウェブサイト、サーバ、あるいはその他の遠隔ソースから命令群が送信される場合、同軸ケーブル、光ファイバ・ケーブル、ツイスト・ペア、DSL、あるいは、例えば赤外線、無線およびマイクロ波のような無線技術が、媒体の定義に含まれる。しかしながら、コンピュータ読取可能な記憶媒体およびデータ記憶媒体は、コネクション、搬送波、信号、またはその他の過渡的な媒体を含まず、代わりに、非過渡的な、有形の記憶媒体に向けられていることが理解されるべきである。本明細書で使用されるディスク(diskおよびdisc)は、コンパクト・ディスク(disc)(CD)、レーザ・ディスク(disc)、光ディスク(disc)、デジタル多用途ディスク(disc)(DVD)、フロッピー(登録商標)ディスク(disk)、およびブルー・レイ・ディスク(disc)を含む。これらdiscは、レーザを用いてデータを光学的に再生する。それに対して、diskは、通常、データを磁気的に再生する。前述した組み合わせもまた、コンピュータ読取可能な媒体の範囲内に含まれるべきである。
命令群は、例えば1または複数のデジタル信号プロセッサ(DSP)、汎用マイクロプロセッサ、特定用途向けIC(ASIC)、フィールド・プログラマブル・ロジック・アレイ(FPGA)、またはその他等価な集積またはディスクリート論理回路のような1または複数のプロセッサによって実行されうる。したがって、本明細書で使用されているように、用語「プロセッサ」は、前述した構成、または、本明細書に記載された技術の実施のために適切なその他任意の構成のうちの何れかを称しうる。さらに、いくつかの態様では、本明細書に記載された機能は、エンコードおよびデコードのために構成された専用のハードウェアおよび/またはソフトウェア・モジュール内に適用されうるか、または、結合されたコーデック内に組み込まれうる。さらに、これら技術は、1または複数の回路または論理要素で完全に実現されうる。
本開示の技術は、無線ハンドセット、集積回路(IC)、またはICのセット(例えば、チップセット)を含む種々さまざまなデバイスまたは装置において実現されうる。さまざまな構成要素、モジュール、またはユニットは、本開示では、開示された技術を実行するように構成されたデバイスの機能態様を強調するように記載されているが、異なるハードウェア・ユニットによる実現を必ずしも必要とする訳ではない。むしろ、前述されたように、さまざまなユニットは、適切なソフトウェアおよび/またはハードウェアと連携する、前述されたような1または複数のプロセッサを含む共通のハードウェア・ユニットの集合によって提供されうるか、コーデック・ハードウェア・ユニットに結合されうる。
さまざまな例が記載された。これらの例およびその他の例は、以下の特許請求の範囲のスコープ内である。
以下に本願発明の当初の特許請求の範囲に記載された発明を付記する。
[C1]
ビデオ・エンコード方法であって、
ビデオ・データのブロックのため、イントラ予測モードのセットから、イントラ予測モードを決定することと、
前記決定されたイントラ予測モードに基づいて、前記ビデオ・データのブロックのための変換ユニット・パーティションを決定することと、
前記決定された変換ユニット・パーティションを用いて、前記ビデオ・データのブロックをエンコードすることと、
を備えるビデオ・エンコード方法。
[C2]
前記ビデオ・データのブロックは、予測ユニットであり、
前記予測ユニットのパーティションは、前記決定された変換ユニット・パーティションと同じサイズおよび形状を有する、C1に記載のビデオ・エンコード方法。
[C3]
前記決定されたイントラ予測モードに基づいて、変換ユニット・パーティションのセットを決定することをさらに備え、
前記ビデオ・データのブロックのための変換ユニット・パーティションを決定することは、前記変換ユニット・パーティションのセットから、前記変換ユニット・パーティションを決定することを備える、C1に記載のビデオ・エンコード方法。
[C4]
前記決定されたイントラ予測モードは、垂直方向のイントラ予測モードであり、
前記変換ユニット・パーティションのセットは、垂直方向の非正方形変換ユニット・パーティションを含む、C3に記載のビデオ・エンコード方法。
[C5]
前記決定されたイントラ予測モードは、水平方向のイントラ予測モードであり、
前記変換ユニット・パーティションのセットは、水平方向の非正方形変換ユニット・パーティションを含む、C3に記載のビデオ・エンコード方法。
[C6]
前記決定されたイントラ予測モードは、DCモード、平面モード、または対角モードであり、
前記変換ユニット・パーティションのセットは、正方形変換ユニット・パーティションを含む、C3に記載のビデオ・エンコード方法。
[C7]
前記変換ユニット・パーティションのセットは、イントラ予測モード毎に1つの変換ユニット・パーティションしか含んでいない、C3に記載のビデオ・エンコード方法。
[C8]
等しい数の変換ユニット・パーティションが、複数の前記イントラ予測モードのおのおのの変換ユニット・パーティションの各セットに存在する、C3に記載のビデオ・エンコード方法。
[C9]
前記ビデオ・データのブロックは、予測ユニットであり、
前記予測ユニットのパーティションは、前記決定された変換ユニット・パーティションとは異なるサイズおよび形状を有する、C1に記載のビデオ・エンコード方法。
[C10]
前記決定されたイントラ予測モードにしたがって、前記ビデオ・データのブロックに対して、イントラ予測を実行して、予測残余を生成することをさらに備え、
前記変換ユニット・パーティションを決定することは、
前記予測残余における複数の変換パーティションをテストすることと、
前記テストすることに基づいて、前記複数の変換パーティションのうちの1つを、前記決定された変換パーティションとして選択することと
を備える、C1に記載のビデオ・エンコード方法。
[C11]
前記決定された変換パーティションを、エンコードされたビデオ・ビットストリームでシグナルすること、をさらに備えるC1に記載のビデオ・エンコード方法。
[C12]
前記ビデオ・データのブロックのため、複数の予測ユニット・パーティションの中から、予測ユニット・パーティションを決定することと、
前記決定された予測ユニット・パーティションに基づいて、前記イントラ予測モードのセットを決定することと、
をさらに備えるC1に記載のビデオ・エンコード方法。
[C13]
前記決定された予測ユニット・パーティションは、垂直方向の非正方形予測ユニット・パーティションであり、
前記イントラ予測モードのセットは、垂直方向のイントラ予測モードを含む、C12に記載のビデオ・エンコード方法。
[C14]
前記決定された予測ユニット・パーティションは、水平方向の非正方形予測ユニット・パーティションであり、
前記イントラ予測モードのセットは、水平方向のイントラ予測モードを含む、C12に記載のビデオ・エンコード方法。
[C15]
ビデオ・デコード方法であって、
ビデオ・データのブロックのため、複数のイントラ予測モードの中から、イントラ予測モードを示すインジケーションを受信することと、
前記受信されたイントラ予測モードに基づいて、前記ビデオ・データのブロックのための変換ユニット・パーティションを決定することと、
前記決定された変換ユニット・パーティションを用いて、前記ビデオ・データのブロックをデコードすることと、
を備えるビデオ・デコード方法。
[C16]
前記ビデオ・データのブロックは、予測ユニットであり、
前記予測ユニットのパーティションは、前記決定された変換ユニット・パーティションと同じサイズおよび形状を有する、C15に記載のビデオ・デコード方法。
[C17]
前記イントラ予測モードに基づいて、変換ユニット・パーティションのセットを決定することを備え、
前記ビデオ・データのブロックのための変換ユニット・パーティションを決定することは、前記変換ユニット・パーティションのセットから、前記変換ユニット・パーティションを決定することを備える、C15に記載のビデオ・デコード方法。
[C18]
前記イントラ予測モードは、垂直方向のイントラ予測モードであり、
前記変換ユニット・パーティションのセットは、垂直方向の非正方形変換ユニット・パーティションを含む、C17に記載のビデオ・デコード方法。
[C19]
前記イントラ予測モードは、水平方向のイントラ予測モードであり、
前記変換ユニット・パーティションのセットは、水平方向の非正方形変換ユニット・パーティションを含む、C17に記載のビデオ・デコード方法。
[C20]
前記イントラ予測モードは、DCモード、平面モード、または対角モードであり、
前記変換ユニット・パーティションのセットは、正方形変換ユニット・パーティションを含む、C17に記載のビデオ・デコード方法。
[C21]
前記変換ユニット・パーティションのセットは、イントラ予測モード毎に1つの変換ユニット・パーティションしか含んでいない、C17に記載のビデオ・デコード方法。
[C22]
等しい数の変換ユニット・パーティションが、複数の前記イントラ予測モードのおのおのの変換ユニット・パーティションの各セットに存在する、C17に記載のビデオ・デコード方法。
[C23]
前記ビデオ・データのブロックは、予測ユニットであり、
前記予測ユニットのパーティションは、前記決定された変換ユニット・パーティションとは異なるサイズおよび形状を有する、C15に記載のビデオ・デコード方法。
[C24]
前記ビデオ・データのブロックのため、複数の予測ユニット・パーティションの中から、予測ユニット・パーティションを示すインジケーションを受信することと、
前記予測ユニット・パーティションに基づいて、前記イントラ予測モードのセットを決定することと、
をさらに備えるC15に記載のビデオ・デコード方法。
[C25]
前記予測ユニット・パーティションは、垂直方向の非正方形予測ユニット・パーティションであり、前記イントラ予測モードのセットは、垂直方向のイントラ予測モードを含む、C24に記載のビデオ・デコード方法。
[C26]
前記予測ユニット・パーティションは、水平方向の非正方形予測ユニット・パーティションであり、
前記イントラ予測モードのセットは、水平方向のイントラ予測モードを含む、C24に記載のビデオ・デコード方法。
[C27]
ビデオ・エンコード装置であって、
ビデオ・データのブロックのため、イントラ予測モードのセットから、イントラ予測モードを決定し、
前記決定されたイントラ予測モードに基づいて、前記ビデオ・データのブロックの変換ユニット・パーティションを決定し、
前記決定された変換ユニット・パーティションを用いて、前記ビデオ・データのブロックをエンコードする
ように構成されたビデオ・エンコーダ、
を備えるビデオ・エンコード装置。
[C28]
前記ビデオ・データのブロックは、予測ユニットであり、
前記予測ユニットのパーティションは、前記決定された変換ユニット・パーティションと同じサイズおよび形状を有する、C27に記載のビデオ・エンコード装置。
[C29]
前記ビデオ・エンコーダはさらに、前記決定されたイントラ予測モードに基づいて、変換ユニット・パーティションのセットを決定するように構成され、
前記ビデオ・データのブロックのための変換ユニット・パーティションを決定することは、前記変換ユニット・パーティションのセットから、前記変換ユニット・パーティションを決定することを備える、C27に記載のビデオ・エンコード装置。
[C30]
前記決定されたイントラ予測モードは、垂直方向のイントラ予測モードであり、
前記変換ユニット・パーティションのセットは、垂直方向の非正方形変換ユニット・パーティションを含む、C29に記載のビデオ・エンコード装置。
[C31]
前記決定されたイントラ予測モードは、水平方向のイントラ予測モードであり、
前記変換ユニット・パーティションのセットは、水平方向の非正方形変換ユニット・パーティションを含む、C29に記載のビデオ・エンコード装置。
[C32]
前記決定されたイントラ予測モードは、DCモード、平面モード、または対角モードであり、
前記変換ユニット・パーティションのセットは、正方形変換ユニット・パーティションを含む、C29に記載のビデオ・エンコード装置。
[C33]
前記変換ユニット・パーティションのセットは、イントラ予測モード毎に1つの変換ユニット・パーティションしか含んでいない、C29に記載のビデオ・エンコード装置。
[C34]
等しい数の変換ユニット・パーティションが、複数の前記イントラ予測モードのおのおのの変換ユニット・パーティションの各セットに存在する、C29に記載のビデオ・エンコード装置。
[C35]
前記ビデオ・データのブロックは、予測ユニットであり、
前記予測ユニットのパーティションは、前記決定された変換ユニット・パーティションとは異なるサイズおよび形状を有する、C27に記載のビデオ・エンコード装置。
[C36]
前記ビデオ・エンコーダはさらに、
前記決定されたイントラ予測モードにしたがって、前記ビデオ・データのブロックに対して、イントラ予測を実行して、予測残余を生成し、
前記予測残余における複数の変換パーティションをテストし、
前記テストすることに基づいて、前記複数の変換パーティションのうちの1つを、前記決定された変換パーティションとして選択する
ように構成された、C27に記載のビデオ・エンコード装置。
[C37]
前記ビデオ・エンコーダはさらに、前記決定された変換パーティションを、エンコードされたビデオ・ビットストリームでシグナルするように構成された、C27に記載のビデオ・エンコード装置。
[C38]
前記ビデオ・エンコーダはさらに、
前記ビデオ・データのブロックのため、複数の予測ユニット・パーティションの中から、予測ユニット・パーティションを決定し、
前記予測ユニット・パーティションに基づいて、前記イントラ予測モードのセットを決定する
ように構成された、C27に記載のビデオ・エンコード装置。
[C39]
前記決定された予測ユニット・パーティションは、垂直方向の非正方形予測ユニット・パーティションであり、
前記イントラ予測モードのセットは、垂直方向のイントラ予測モードを含む、C38に記載のビデオ・エンコード装置。
[C40]
前記決定された予測ユニット・パーティションは、水平方向の非正方形予測ユニット・パーティションであり、
前記イントラ予測モードのセットは、水平方向のイントラ予測モードを含む、C38に記載のビデオ・エンコード装置。
[C41]
ビデオ・デコード装置であって、
ビデオ・データのブロックのため、複数のイントラ予測モードの中から、イントラ予測モードを示すインジケーションを受信し、
前記受信されたイントラ予測モードに基づいて、前記ビデオ・データのブロックのための変換ユニット・パーティションを決定し、
前記決定された変換ユニット・パーティションを用いて、前記ビデオ・データのブロックをデコードする
ように構成されたビデオ・デコーダ、を備えるビデオ・デコード装置。
[C42]
前記ビデオ・データのブロックは、予測ユニットであり、
前記予測ユニットのパーティションは、前記決定された変換ユニット・パーティションと同じサイズおよび形状を有する、C41に記載のビデオ・デコード装置。
[C43]
前記ビデオ・デコーダはさらに、前記イントラ予測モードに基づいて、変換ユニット・パーティションのセットを決定するように構成され、
前記ビデオ・データのブロックのための変換ユニット・パーティションを決定することは、前記変換ユニット・パーティションのセットから、前記変換ユニット・パーティションを決定することを備える、C41に記載のビデオ・デコード装置。
[C44]
前記イントラ予測モードは、垂直方向のイントラ予測モードであり、
前記変換ユニット・パーティションのセットは、垂直方向の非正方形変換ユニット・パーティションを含む、C43に記載のビデオ・デコード装置。
[C45]
前記イントラ予測モードは、水平方向のイントラ予測モードであり、
前記変換ユニット・パーティションのセットは、水平方向の非正方形変換ユニット・パーティションを含む、C43に記載のビデオ・デコード装置。
[C46]
前記イントラ予測モードは、DCモード、平面モード、または対角モードであり、
前記変換ユニット・パーティションのセットは、正方形変換ユニット・パーティションを含む、C43に記載のビデオ・デコード装置。
[C47]
前記変換ユニット・パーティションのセットは、イントラ予測モード毎に1つの変換ユニット・パーティションしか含んでいない、C43に記載のビデオ・デコード装置。
[C48]
等しい数の変換ユニット・パーティションが、複数の前記イントラ予測モードのおのおのの変換ユニット・パーティションの各セットに存在する、C43に記載のビデオ・デコード装置。
[C49]
前記ビデオ・データのブロックは、予測ユニットであり、
前記予測ユニットのパーティションは、前記決定された変換ユニット・パーティションとは異なるサイズおよび形状を有する、C41に記載のビデオ・デコード装置。
[C50]
前記ビデオ・デコーダはさらに、
前記ビデオ・データのブロックのため、複数の予測ユニット・パーティションの中から、予測ユニット・パーティションを示すインジケーションを受信し、
前記予測ユニット・パーティションに基づいて、前記イントラ予測モードのセットを決定する
ように構成された、C41に記載のビデオ・デコード装置。
[C51]
前記予測ユニット・パーティションは、垂直方向の非正方形予測ユニット・パーティションであり、
前記イントラ予測モードのセットは、垂直方向のイントラ予測モードを含む、C50に記載のビデオ・デコード装置。
[C52]
前記予測ユニット・パーティションは、水平方向の非正方形予測ユニット・パーティションであり、
前記イントラ予測モードのセットは、水平方向のイントラ予測モードを含む、C50に記載のビデオ・デコード装置。
[C53]
ビデオ・エンコード装置であって、
ビデオ・データのブロックのため、イントラ予測モードのセットから、イントラ予測モードを決定する手段と、
前記決定されたイントラ予測モードに基づいて、前記ビデオ・データのブロックのための変換ユニット・パーティションを決定する手段と、
前記決定された変換ユニット・パーティションを用いて、前記ビデオ・データのブロックをエンコードする手段と、
を備えるビデオ・エンコード装置。
[C54]
ビデオ・デコード装置であって、
ビデオ・データのブロックのため、複数のイントラ予測モードの中から、イントラ予測モードを示すインジケーションを受信する手段と、
前記受信されたイントラ予測モードに基づいて、前記ビデオ・データのブロックのための変換ユニット・パーティションを決定する手段と、
前記決定された変換ユニット・パーティションを用いて、前記ビデオ・データのブロックをデコードする手段と、
を備えるビデオ・デコード装置。
[C55]
実行された場合、1または複数のプロセッサに対して、
ビデオ・データのブロックのため、イントラ予測モードのセットから、イントラ予測モードを決定し、
前記決定されたイントラ予測モードに基づいて、前記ビデオ・データのブロックの変換ユニット・パーティションを決定し、
前記決定された変換ユニット・パーティションを用いて、前記ビデオ・データのブロックをエンコードする
ために、ビデオ・データをエンコードさせる命令群を格納したコンピュータ読取可能な記憶媒体。
[C56]
実行された場合、1または複数のプロセッサに対して、
ビデオ・データのブロックのため、複数のイントラ予測モードの中から、イントラ予測モードを示すインジケーションを受信し、
前記受信されたイントラ予測モードに基づいて、前記ビデオ・データのブロックのための変換ユニット・パーティションを決定し、
前記決定された変換ユニット・パーティションを用いて、前記ビデオ・データのブロックをデコードする
ために、ビデオ・データをエンコードさせる命令群を格納したコンピュータ読取可能な記憶媒体。

Claims (48)

  1. ビデオ・エンコード方法であって、
    ビデオ・データの予測ユニットに対するイントラ予測モードのセットから、イントラ予測モードを決定することと、
    前記決定されたイントラ予測モードに基づいて、変換ユニット・パーティションのセットから変換ユニット・パーティションのサブセットを決定することと、ここで、前記変換ユニット・パーティションのサブセットは、イントラ予測モード毎に指定された変換ユニット・パーティションを含み、
    前記変換ユニット・パーティションのサブセットから、前記ビデオ・データの予測ユニットに対する変換ユニット・パーティションを決定することと、
    前記決定された変換ユニット・パーティションを用いて、前記ビデオ・データの予測ユニットをエンコードすることと、
    を備えるビデオ・エンコード方法。
  2. 前記決定されたイントラ予測モードは、垂直方向のイントラ予測モードであり、
    前記変換ユニット・パーティションのサブセットは、垂直方向の非正方形変換ユニット・パーティションを含む、請求項1に記載のビデオ・エンコード方法。
  3. 前記決定されたイントラ予測モードは、水平方向のイントラ予測モードであり、
    前記変換ユニット・パーティションのサブセットは、水平方向の非正方形変換ユニット・パーティションを含む、請求項1に記載のビデオ・エンコード方法。
  4. 前記決定されたイントラ予測モードは、DCモード、平面モード、または対角モードであり、
    前記変換ユニット・パーティションのサブセットは、正方形変換ユニット・パーティションを含む、請求項1に記載のビデオ・エンコード方法。
  5. 前記変換ユニット・パーティションのサブセットは、イントラ予測モード毎に1つの変換ユニット・パーティションしか含んでいない、請求項1に記載のビデオ・エンコード方法。
  6. 等しい数の変換ユニット・パーティションが、前記イントラ予測モードのセットにおけるイントラ予測モードのおのおのの変換ユニット・パーティションの各サブセットに存在する、請求項1に記載のビデオ・エンコード方法。
  7. 前記予測ユニットのパーティションは、前記決定された変換ユニット・パーティションとは異なるサイズおよび形状を有する、請求項1に記載のビデオ・エンコード方法。
  8. 前記決定されたイントラ予測モードにしたがって、前記ビデオ・データの予測ユニットに対して、イントラ予測を実行して、予測残余を生成することをさらに備え、
    前記変換ユニット・パーティションを決定することは、
    前記予測残余における前記決定された変換ユニット・パーティションのサブセットの複数の変換ユニット・パーティションをテストすることと、
    前記テストすることに基づいて、前記複数の変換ユニット・パーティションのうちの1つを、前記決定された変換ユニット・パーティションとして選択することと
    を備える、請求項1に記載のビデオ・エンコード方法。
  9. 前記決定された変換ユニット・パーティションを、エンコードされたビデオ・ビットストリームでシグナルすること、をさらに備える請求項1に記載のビデオ・エンコード方法。
  10. 前記ビデオ・データの予測ユニットに対する複数の予測ユニット・パーティションの中から、予測ユニット・パーティションを決定することと、
    前記決定された予測ユニット・パーティションに基づいて、前記イントラ予測モードのセットを決定することと、
    をさらに備える請求項1に記載のビデオ・エンコード方法。
  11. 前記決定された予測ユニット・パーティションは、垂直方向の非正方形予測ユニット・パーティションであり、
    前記イントラ予測モードのセットは、垂直方向のイントラ予測モードを含む、請求項10に記載のビデオ・エンコード方法。
  12. 前記決定された予測ユニット・パーティションは、水平方向の非正方形予測ユニット・パーティションであり、
    前記イントラ予測モードのセットは、水平方向のイントラ予測モードを含む、請求項10に記載のビデオ・エンコード方法。
  13. ビデオ・デコード方法であって、
    ビデオ・データの予測ユニットに対するイントラ予測モードのセットの中から、イントラ予測モードを示すインジケーションを受信することと、
    前記インジケーションにより指示されたイントラ予測モードに基づいて、変換ユニット・パーティションのセットから変換ユニット・パーティションのサブセットを決定することと、ここで、前記変換ユニット・パーティションのサブセットは、イントラ予測モード毎に指定された変換ユニット・パーティションを含み、
    前記変換ユニット・パーティションのサブセットから、前記ビデオ・データの予測ユニットに対する変換ユニット・パーティションを決定することと、
    前記決定された変換ユニット・パーティションを用いて、前記ビデオ・データの予測ユニットをデコードすることと、
    を備えるビデオ・デコード方法。
  14. 前記イントラ予測モードは、垂直方向のイントラ予測モードであり、
    前記変換ユニット・パーティションのサブセットは、垂直方向の非正方形変換ユニット・パーティションを含む、請求項13に記載のビデオ・デコード方法。
  15. 前記イントラ予測モードは、水平方向のイントラ予測モードであり、
    前記変換ユニット・パーティションのサブセットは、水平方向の非正方形変換ユニット・パーティションを含む、請求項13に記載のビデオ・デコード方法。
  16. 前記イントラ予測モードは、DCモード、平面モード、または対角モードであり、
    前記変換ユニット・パーティションのサブセットは、正方形変換ユニット・パーティションを含む、請求項13に記載のビデオ・デコード方法。
  17. 前記変換ユニット・パーティションのサブセットは、イントラ予測モード毎に1つの変換ユニット・パーティションしか含んでいない、請求項13に記載のビデオ・デコード方法。
  18. 等しい数の変換ユニット・パーティションが、前記イントラ予測モードのセットにおけるイントラ予測モードのおのおのの変換ユニット・パーティションの各サブセットに存在する、請求項13に記載のビデオ・デコード方法。
  19. 前記予測ユニットのパーティションは、前記決定された変換ユニット・パーティションとは異なるサイズおよび形状を有する、請求項13に記載のビデオ・デコード方法。
  20. 前記ビデオ・データの予測ユニットに対する複数の予測ユニット・パーティションの中から、予測ユニット・パーティションを示すインジケーションを受信することと、
    前記予測ユニット・パーティションに基づいて、前記イントラ予測モードのセットを決定することと、
    をさらに備える請求項13に記載のビデオ・デコード方法。
  21. 前記予測ユニット・パーティションは、垂直方向の非正方形予測ユニット・パーティションであり、前記イントラ予測モードのセットは、垂直方向のイントラ予測モードを含む、請求項20に記載のビデオ・デコード方法。
  22. 前記予測ユニット・パーティションは、水平方向の非正方形予測ユニット・パーティションであり、
    前記イントラ予測モードのセットは、水平方向のイントラ予測モードを含む、請求項20に記載のビデオ・デコード方法。
  23. ビデオ・エンコード装置であって、
    ビデオ・データを格納するように構成されているメモリと、
    前記メモリと通信するビデオ・エンコーダとを備え、
    前記ビデオ・エンコーダは、
    前記ビデオ・データの予測ユニットに対するイントラ予測モードのセットから、イントラ予測モードを決定し、
    前記決定されたイントラ予測モードに基づいて、変換ユニット・パーティションのセットから変換ユニット・パーティションのサブセットを決定し、ここで、前記変換ユニット・パーティションのサブセットは、イントラ予測モード毎に指定された変換ユニット・パーティションを含み、
    前記変換ユニット・パーティションのサブセットから、前記ビデオ・データの予測ユニットに対する変換ユニット・パーティションを決定し、
    前記決定された変換ユニット・パーティションを用いて、前記ビデオ・データの予測ユニットをエンコードする
    ように構成されたビデオ・エンコード装置。
  24. 前記決定されたイントラ予測モードは、垂直方向のイントラ予測モードであり、
    前記変換ユニット・パーティションのサブセットは、垂直方向の非正方形変換ユニット・パーティションを含む、請求項23に記載のビデオ・エンコード装置。
  25. 前記決定されたイントラ予測モードは、水平方向のイントラ予測モードであり、
    前記変換ユニット・パーティションのサブセットは、水平方向の非正方形変換ユニット・パーティションを含む、請求項23に記載のビデオ・エンコード装置。
  26. 前記決定されたイントラ予測モードは、DCモード、平面モード、または対角モードであり、
    前記変換ユニット・パーティションのサブセットは、正方形変換ユニット・パーティションを含む、請求項23に記載のビデオ・エンコード装置。
  27. 前記変換ユニット・パーティションのサブセットは、イントラ予測モード毎に1つの変換ユニット・パーティションしか含んでいない、請求項23に記載のビデオ・エンコード装置。
  28. 等しい数の変換ユニット・パーティションが、前記イントラ予測モードのセットにおけるイントラ予測モードのおのおのの変換ユニット・パーティションの各サブセットに存在する、請求項23に記載のビデオ・エンコード装置。
  29. 前記予測ユニットのパーティションは、前記決定された変換ユニット・パーティションとは異なるサイズおよび形状を有する、請求項23に記載のビデオ・エンコード装置。
  30. 前記ビデオ・エンコーダはさらに、
    前記決定されたイントラ予測モードにしたがって、前記ビデオ・データの予測ユニットに対して、イントラ予測を実行して、予測残余を生成し、
    前記予測残余における前記決定された変換ユニット・パーティションのサブセットの複数の変換ユニット・パーティションをテストし、
    前記テストすることに基づいて、前記複数の変換ユニット・パーティションのうちの1つを、前記決定された変換ユニット・パーティションとして選択する
    ように構成された、請求項23に記載のビデオ・エンコード装置。
  31. 前記ビデオ・エンコーダはさらに、前記決定された変換ユニット・パーティションを、エンコードされたビデオ・ビットストリームでシグナルするように構成された、請求項23に記載のビデオ・エンコード装置。
  32. 前記ビデオ・エンコーダはさらに、
    前記ビデオ・データの予測ユニットに対する複数の予測ユニット・パーティションの中から、予測ユニット・パーティションを決定し、
    前記決定された予測ユニット・パーティションに基づいて、前記イントラ予測モードのセットを決定する
    ように構成された、請求項23に記載のビデオ・エンコード装置。
  33. 前記決定された予測ユニット・パーティションは、垂直方向の非正方形予測ユニット・パーティションであり、
    前記イントラ予測モードのセットは、垂直方向のイントラ予測モードを含む、請求項32に記載のビデオ・エンコード装置。
  34. 前記決定された予測ユニット・パーティションは、水平方向の非正方形予測ユニット・パーティションであり、
    前記イントラ予測モードのセットは、水平方向のイントラ予測モードを含む、請求項32に記載のビデオ・エンコード装置。
  35. ビデオ・デコード装置であって、
    ビデオ・データを格納するように構成されているメモリと、
    前記メモリと通信するビデオ・デコーダとを備え、
    前記ビデオ・デコーダは、
    前記ビデオ・データの予測ユニットに対するイントラ予測モードのセットの中から、イントラ予測モードを示すインジケーションを受信し、
    前記インジケーションにより指示されたイントラ予測モードに基づいて、変換ユニット・パーティションのセットから変換ユニット・パーティションのサブセットを決定し、ここで、前記変換ユニット・パーティションのサブセットは、イントラ予測モード毎に指定された変換ユニット・パーティションを含み、
    前記変換ユニット・パーティションのサブセットから、前記ビデオ・データの予測ユニットに対する変換ユニット・パーティションを決定し、
    前記決定された変換ユニット・パーティションを用いて、前記ビデオ・データの予測ユニットをデコードする
    ように構成されたビデオ・デコード装置。
  36. 前記イントラ予測モードは、垂直方向のイントラ予測モードであり、
    前記変換ユニット・パーティションのサブセットは、垂直方向の非正方形変換ユニット・パーティションを含む、請求項35に記載のビデオ・デコード装置。
  37. 前記イントラ予測モードは、水平方向のイントラ予測モードであり、
    前記変換ユニット・パーティションのサブセットは、水平方向の非正方形変換ユニット・パーティションを含む、請求項35に記載のビデオ・デコード装置。
  38. 前記イントラ予測モードは、DCモード、平面モード、または対角モードであり、
    前記変換ユニット・パーティションのサブセットは、正方形変換ユニット・パーティションを含む、請求項35に記載のビデオ・デコード装置。
  39. 前記変換ユニット・パーティションのサブセットは、イントラ予測モード毎に1つの変換ユニット・パーティションしか含んでいない、請求項35に記載のビデオ・デコード装置。
  40. 等しい数の変換ユニット・パーティションが、前記イントラ予測モードのセットにおけるイントラ予測モードのおのおのの変換ユニット・パーティションの各サブセットに存在する、請求項35に記載のビデオ・デコード装置。
  41. 前記予測ユニットのパーティションは、前記決定された変換ユニット・パーティションとは異なるサイズおよび形状を有する、請求項35に記載のビデオ・デコード装置。
  42. 前記ビデオ・デコーダはさらに、
    前記ビデオ・データの予測ユニットに対する複数の予測ユニット・パーティションの中から、予測ユニット・パーティションを示すインジケーションを受信し、
    前記予測ユニット・パーティションに基づいて、前記イントラ予測モードのセットを決定する
    ように構成された、請求項35に記載のビデオ・デコード装置。
  43. 前記予測ユニット・パーティションは、垂直方向の非正方形予測ユニット・パーティションであり、
    前記イントラ予測モードのセットは、垂直方向のイントラ予測モードを含む、請求項42に記載のビデオ・デコード装置。
  44. 前記予測ユニット・パーティションは、水平方向の非正方形予測ユニット・パーティションであり、
    前記イントラ予測モードのセットは、水平方向のイントラ予測モードを含む、請求項42に記載のビデオ・デコード装置。
  45. ビデオ・エンコード装置であって、
    ビデオ・データの予測ユニットに対するイントラ予測モードのセットから、イントラ予測モードを決定する手段と、
    前記決定されたイントラ予測モードに基づいて、変換ユニット・パーティションのセットから変換ユニット・パーティションのサブセットを決定する手段と、ここで、前記変換ユニット・パーティションのサブセットは、イントラ予測モード毎に指定された変換ユニット・パーティションを含み、
    前記変換ユニット・パーティションのサブセットから、前記ビデオ・データの予測ユニットに対する変換ユニット・パーティションを決定する手段と、
    前記決定された変換ユニット・パーティションを用いて、前記ビデオ・データの予測ユニットをエンコードする手段と、
    を備えるビデオ・エンコード装置。
  46. ビデオ・デコード装置であって、
    ビデオ・データの予測ユニットに対する複数のイントラ予測モードの中から、イントラ予測モードを示すインジケーションを受信する手段と、
    前記インジケーションにより指示されたイントラ予測モードに基づいて、変換ユニット・パーティションのセットから変換ユニット・パーティションのサブセットを決定する手段と、ここで、前記変換ユニット・パーティションのサブセットは、イントラ予測モード毎に指定された変換ユニット・パーティションを含み、
    前記変換ユニット・パーティションのサブセットから、前記ビデオ・データの予測ユニットに対する変換ユニット・パーティションを決定する手段と、
    前記決定された変換ユニット・パーティションを用いて、前記ビデオ・データの予測ユニットをデコードする手段と、
    を備えるビデオ・デコード装置。
  47. 一時的でないコンピュータ読取可能な記憶媒体であって、
    実行された場合、1または複数のプロセッサに対して、
    ビデオ・データの予測ユニットに対するイントラ予測モードのセットから、イントラ予測モードを決定し、
    前記決定されたイントラ予測モードに基づいて、変換ユニット・パーティションのセットから変換ユニット・パーティションのサブセットを決定し、ここで、前記変換ユニット・パーティションのサブセットは、イントラ予測モード毎に指定された変換ユニット・パーティションを含み、
    前記変換ユニット・パーティションのサブセットから、前記ビデオ・データの予測ユニットに対する変換ユニット・パーティションを決定し、
    前記決定された変換ユニット・パーティションを用いて、前記ビデオ・データの予測ユニットをエンコードする
    ために、ビデオ・データをエンコードさせる命令群を格納するコンピュータ読取可能な記憶媒体。
  48. 一時的でないコンピュータ読取可能な記憶媒体であって、
    実行された場合、1または複数のプロセッサに対して、
    ビデオ・データの予測ユニットに対する複数のイントラ予測モードの中から、イントラ予測モードを示すインジケーションを受信し、
    前記インジケーションにより指示されたイントラ予測モードに基づいて、変換ユニット・パーティションのセットから変換ユニット・パーティションのサブセットを決定し、ここで、前記変換ユニット・パーティションのサブセットは、イントラ予測モード毎に指定された変換ユニット・パーティションを含み、
    前記変換ユニット・パーティションのサブセットから、前記ビデオ・データの予測ユニットに対する変換ユニット・パーティションを決定し、
    前記決定された変換ユニット・パーティションを用いて、前記ビデオ・データの予測ユニットをデコードする
    ために、ビデオ・データをデコードさせる命令群を格納するコンピュータ読取可能な記憶媒体。
JP2014530737A 2011-09-12 2012-09-11 ビデオ・コーディングにおける非正方形変換ユニットおよび予測ユニット Expired - Fee Related JP6022579B2 (ja)

Applications Claiming Priority (9)

Application Number Priority Date Filing Date Title
US201161533703P 2011-09-12 2011-09-12
US61/533,703 2011-09-12
US201161536414P 2011-09-19 2011-09-19
US61/536,414 2011-09-19
US201161552216P 2011-10-27 2011-10-27
US61/552,216 2011-10-27
US13/608,380 US9787982B2 (en) 2011-09-12 2012-09-10 Non-square transform units and prediction units in video coding
US13/608,380 2012-09-10
PCT/US2012/054654 WO2013039908A2 (en) 2011-09-12 2012-09-11 Non-square transform units and prediction units in video coding

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2016123785A Division JP2016201808A (ja) 2011-09-12 2016-06-22 ビデオ・コーディングにおける非正方形変換ユニットおよび予測ユニット

Publications (2)

Publication Number Publication Date
JP2014530537A JP2014530537A (ja) 2014-11-17
JP6022579B2 true JP6022579B2 (ja) 2016-11-09

Family

ID=46852425

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2014530737A Expired - Fee Related JP6022579B2 (ja) 2011-09-12 2012-09-11 ビデオ・コーディングにおける非正方形変換ユニットおよび予測ユニット
JP2016123785A Pending JP2016201808A (ja) 2011-09-12 2016-06-22 ビデオ・コーディングにおける非正方形変換ユニットおよび予測ユニット

Family Applications After (1)

Application Number Title Priority Date Filing Date
JP2016123785A Pending JP2016201808A (ja) 2011-09-12 2016-06-22 ビデオ・コーディングにおける非正方形変換ユニットおよび予測ユニット

Country Status (6)

Country Link
US (1) US9787982B2 (ja)
EP (1) EP2756676B1 (ja)
JP (2) JP6022579B2 (ja)
KR (1) KR101671080B1 (ja)
CN (1) CN103797801B (ja)
WO (1) WO2013039908A2 (ja)

Families Citing this family (93)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130089136A1 (en) * 2011-10-10 2013-04-11 Texas Instruments Incorporated Spatial Intra Prediction Estimation Based on Mode Suppression in Macroblocks of a Video Frame
US20130136180A1 (en) * 2011-11-29 2013-05-30 Futurewei Technologies, Inc. Unified Partitioning Structures and Signaling Methods for High Efficiency Video Coding
WO2013106986A1 (en) * 2012-01-16 2013-07-25 Mediatek Singapore Pte. Ltd. Methods and apparatuses of intra mode coding
AU2012200319B2 (en) 2012-01-19 2015-11-26 Canon Kabushiki Kaisha Method, apparatus and system for encoding and decoding the significance map for residual coefficients of a transform unit
AU2012200345B2 (en) * 2012-01-20 2014-05-01 Canon Kabushiki Kaisha Method, apparatus and system for encoding and decoding the significance map residual coefficients of a transform unit
CN104247423B (zh) * 2012-03-21 2018-08-07 联发科技(新加坡)私人有限公司 可伸缩视频编码系统的帧内模式编码方法和装置
GB2501535A (en) * 2012-04-26 2013-10-30 Sony Corp Chrominance Processing in High Efficiency Video Codecs
US9344742B2 (en) * 2012-08-10 2016-05-17 Google Inc. Transform-domain intra prediction
US9819965B2 (en) * 2012-11-13 2017-11-14 Intel Corporation Content adaptive transform coding for next generation video
EP2946552B1 (en) * 2013-01-16 2018-03-21 BlackBerry Limited Context determination for entropy coding of run-length encoded transform coefficients
US9544597B1 (en) * 2013-02-11 2017-01-10 Google Inc. Hybrid transform in video encoding and decoding
US9967559B1 (en) 2013-02-11 2018-05-08 Google Llc Motion vector dependent spatial transformation in video coding
US9674530B1 (en) 2013-04-30 2017-06-06 Google Inc. Hybrid transforms in video coding
WO2015015681A1 (ja) * 2013-07-31 2015-02-05 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ 画像符号化方法および画像符号化装置
CN104754362B (zh) * 2014-01-01 2021-11-02 上海天荷电子信息有限公司 使用精细划分块匹配的图像压缩方法
WO2015139173A1 (en) * 2014-03-17 2015-09-24 Mediatek Singapore Pte. Ltd. Improved method for block vector coding
US9565451B1 (en) 2014-10-31 2017-02-07 Google Inc. Prediction dependent transform coding
GB201421095D0 (en) * 2014-11-27 2015-01-14 British Broadcasting Corp HEVC Optimization techniques
EP3276958A4 (en) * 2015-03-23 2018-08-29 LG Electronics Inc. Method for processing image on basis of intra prediction mode and apparatus therefor
WO2016154963A1 (en) * 2015-04-01 2016-10-06 Mediatek Inc. Methods for chroma coding in video codec
CN115134591A (zh) * 2015-06-05 2022-09-30 杜比实验室特许公司 图像编解码方法、比特流存储方法
US9769499B2 (en) 2015-08-11 2017-09-19 Google Inc. Super-transform video coding
GB2557809B (en) 2015-08-28 2021-12-01 Kt Corp Method and device for processing video signal
KR20170031643A (ko) * 2015-09-11 2017-03-21 주식회사 케이티 비디오 신호 처리 방법 및 장치
US10277905B2 (en) 2015-09-14 2019-04-30 Google Llc Transform selection for non-baseband signal coding
WO2017052118A1 (ko) * 2015-09-23 2017-03-30 엘지전자 주식회사 영상 코딩 시스템에서 인트라 예측 방법 및 장치
US10638132B2 (en) 2015-10-15 2020-04-28 Lg Electronics Inc. Method for encoding and decoding video signal, and apparatus therefor
US9807423B1 (en) 2015-11-24 2017-10-31 Google Inc. Hybrid transform scheme for video coding
US10200719B2 (en) * 2015-11-25 2019-02-05 Qualcomm Incorporated Modification of transform coefficients for non-square transform units in video coding
US10560702B2 (en) * 2016-01-22 2020-02-11 Intel Corporation Transform unit size determination for video coding
WO2017131966A1 (en) 2016-01-28 2017-08-03 Invent Medical Corporation System and method for preventing cross-contamination in flow generation systems
CN105578190B (zh) * 2016-02-03 2018-05-04 珠海全志科技股份有限公司 应用于视频硬解码的无损压缩方法及系统
BR112018015266A2 (pt) 2016-02-12 2018-12-18 Thomson Licensing método e dispositivo para codificação/decodificação intra-preditiva de uma unidade de codificação compreendendo dados de imagem, a dita codificação intra-preditiva dependendo de uma árvore de predição e de uma árvore de transformadas
WO2017142335A1 (ko) * 2016-02-16 2017-08-24 삼성전자 주식회사 비디오 복호화 방법 및 그 장치 및 비디오 부호화 방법 및 그 장치
US11032550B2 (en) * 2016-02-25 2021-06-08 Mediatek Inc. Method and apparatus of video coding
CN116506602A (zh) 2016-03-11 2023-07-28 数字洞察力有限公司 视频编码方法以及装置
US11259047B2 (en) 2016-04-06 2022-02-22 Kt Corporation Method and apparatus for processing video signal
WO2017188565A1 (ko) * 2016-04-25 2017-11-02 엘지전자 주식회사 영상 코딩 시스템에서 영상 디코딩 방법 및 장치
CN113810707A (zh) * 2016-04-29 2021-12-17 世宗大学校产学协力团 用于对图像信号进行编码和解码的方法和装置
GB2550579A (en) * 2016-05-23 2017-11-29 Sony Corp Image data encoding and decoding
US11736712B2 (en) 2016-05-28 2023-08-22 Industry Academy Cooperation Foundation Of Sejong University Method and apparatus for encoding or decoding video signal
CN114222140A (zh) * 2016-05-28 2022-03-22 世宗大学校产学协力团 视频信号的解码方法
US11647228B2 (en) * 2016-07-15 2023-05-09 Lg Electronics Inc. Method and apparatus for encoding and decoding video signal using transform domain prediction for prediction unit partition
US11438582B2 (en) * 2016-08-03 2022-09-06 Kt Corporation Video signal processing method and device for performing intra-prediction for an encoding/decoding target block
CN116634146A (zh) * 2016-08-08 2023-08-22 Lg电子株式会社 视频信号解码装置、视频信号编码装置和发送数据的装置
WO2018044087A1 (ko) * 2016-08-31 2018-03-08 주식회사 케이티 비디오 신호 처리 방법 및 장치
WO2018056703A1 (ko) * 2016-09-20 2018-03-29 주식회사 케이티 비디오 신호 처리 방법 및 장치
JP6792996B2 (ja) * 2016-10-12 2020-12-02 日本放送協会 符号化装置、復号装置及びプログラム
JPWO2018092868A1 (ja) 2016-11-21 2019-10-17 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America 符号化装置、復号装置、符号化方法及び復号方法
WO2018092869A1 (ja) * 2016-11-21 2018-05-24 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ 符号化装置、復号装置、符号化方法及び復号方法
US10681354B2 (en) * 2016-12-05 2020-06-09 Lg Electronics Inc. Image encoding/decoding method and apparatus therefor
CN115802033A (zh) * 2016-12-23 2023-03-14 华为技术有限公司 一种用于处理矩形视频编码块的比特流的系统及方法
FI20175006A1 (en) * 2017-01-03 2019-02-15 Nokia Technologies Oy Video and image coding using wide-angle intra-prediction
US10904568B2 (en) 2017-03-09 2021-01-26 Kt Corporation Video signal processing method and device for intra prediction of coding or prediction blocks based on sample position based parameters
US11399187B2 (en) * 2017-03-10 2022-07-26 Intel Corporation Screen content detection for adaptive encoding
CN116684602A (zh) * 2017-03-31 2023-09-01 松下电器(美国)知识产权公司 图像编码装置及方法、图像解码装置及方法、存储介质
JP2020109884A (ja) * 2017-04-28 2020-07-16 シャープ株式会社 動画像符号化装置及び動画像復号装置
CN117395403A (zh) * 2017-04-28 2024-01-12 英迪股份有限公司 图像解码方法、图像编码方法和用于发送比特流的方法
EP3451663A1 (en) * 2017-08-31 2019-03-06 Thomson Licensing Pools of transforms for local selection of a set of transforms in video coding
KR102391834B1 (ko) * 2017-11-17 2022-04-27 에프쥐 이노베이션 컴퍼니 리미티드 조정된 인트라 모드 목록에 기초한 비디오 데이터를 코딩하기 위한 디바이스 및 방법
WO2019107997A1 (ko) * 2017-11-30 2019-06-06 엘지전자 주식회사 비디오 신호의 처리 방법 및 장치
US10652550B2 (en) 2017-12-22 2020-05-12 Shenzhen China Star Optoelectronics Semiconductor Display Technology Co., Ltd. Compensation table compressing method
CN108172168B (zh) * 2017-12-22 2019-11-15 深圳市华星光电半导体显示技术有限公司 一种补偿表压缩方法
US20190045195A1 (en) * 2018-03-30 2019-02-07 Intel Corporation Reduced Partitioning and Mode Decisions Based on Content Analysis and Learning
KR20210049213A (ko) * 2018-04-24 2021-05-04 삼성전자주식회사 비디오 부호화 방법 및 장치, 비디오 복호화 방법 및 장치
KR102617359B1 (ko) * 2018-05-10 2023-12-21 삼성전자주식회사 비디오 부호화 방법 및 장치, 비디오 복호화 방법 및 장치
US11856184B2 (en) * 2018-05-14 2023-12-26 Interdigital Vc Holdings, Inc. Block shape adaptive intra prediction directions for quadtree-binary tree
US10778971B2 (en) 2018-06-01 2020-09-15 Tencent America LLC Method and apparatus for video coding
WO2020017987A1 (en) * 2018-06-29 2020-01-23 Huawei Technologies Co., Ltd Intra-prediction apparatus, encoding apparatus, decoding apparatus and methods
CN110677678B (zh) * 2018-07-01 2022-09-23 北京字节跳动网络技术有限公司 依赖形状的帧间编码
US10284844B1 (en) 2018-07-02 2019-05-07 Tencent America LLC Method and apparatus for video coding
US10382772B1 (en) 2018-07-02 2019-08-13 Tencent America LLC Method and apparatus for video coding
CN108989801B (zh) * 2018-07-27 2021-10-08 福州大学至诚学院 一种基于时空特性的自适应模式选择快速方法
KR102551361B1 (ko) * 2018-08-24 2023-07-05 삼성전자주식회사 부호화 방법 및 그 장치, 복호화 방법 및 그 장치
FR3086485A1 (fr) * 2018-09-21 2020-03-27 Orange Procedes et dispositifs de codage et de decodage d'un flux de donnees representatif d'au moins une image.
US20210377553A1 (en) * 2018-11-12 2021-12-02 Interdigital Vc Holdings, Inc. Virtual pipeline for video encoding and decoding
GB2579824B (en) 2018-12-14 2022-05-18 British Broadcasting Corp Video encoding and video decoding
CN116744008A (zh) * 2018-12-15 2023-09-12 华为技术有限公司 图像重建方法和装置
GB2580326A (en) 2018-12-28 2020-07-22 British Broadcasting Corp Video encoding and video decoding
US11445203B2 (en) * 2019-01-04 2022-09-13 Qualcomm Incorporated Sub-partition intra prediction in video coding
US11172197B2 (en) * 2019-01-13 2021-11-09 Tencent America LLC Most probable mode list generation scheme
WO2020163535A1 (en) * 2019-02-05 2020-08-13 Beijing Dajia Internet Information Technology Co., Ltd. Video coding using intra sub-partition coding mode
US11533506B2 (en) * 2019-02-08 2022-12-20 Tencent America LLC Method and apparatus for video coding
WO2020180151A1 (ko) * 2019-03-07 2020-09-10 엘지전자 주식회사 비디오 신호를 처리하기 위한 방법 및 장치
US10666986B1 (en) * 2019-03-08 2020-05-26 Sony Corporation Sub-block based entropy coding for embedded image codec
GB2582023A (en) * 2019-03-08 2020-09-09 British Broadcasting Corp Method of signalling in a video codec
US20220167009A1 (en) * 2019-03-12 2022-05-26 Sharp Kabushiki Kaisha Systems and methods for performing intra prediction coding in video coding
US11122297B2 (en) 2019-05-03 2021-09-14 Google Llc Using border-aligned block functions for image compression
WO2020256523A1 (ko) * 2019-06-20 2020-12-24 엘지전자 주식회사 광각 화면 내 예측을 이용한 영상 부호화/복호화 방법, 장치 및 비트스트림을 전송하는 방법
CN112135147B (zh) * 2019-06-24 2023-02-28 杭州海康威视数字技术股份有限公司 编码方法、解码方法及装置
US11363295B2 (en) 2019-11-27 2022-06-14 Tencent America LLC Method and system for intra mode coding
US20220150518A1 (en) * 2020-11-11 2022-05-12 Tencent America LLC Method and apparatus for video coding
CN117716692A (zh) * 2021-06-30 2024-03-15 抖音视界有限公司 递归预测单元在视频编解码中的应用

Family Cites Families (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1209928C (zh) 2003-07-04 2005-07-06 清华大学 一种基于预测块组的采用帧内预测的帧内编码帧编码方法
US8582663B2 (en) * 2006-08-08 2013-11-12 Core Wireless Licensing S.A.R.L. Method, device, and system for multiplexing of video streams
US8571104B2 (en) * 2007-06-15 2013-10-29 Qualcomm, Incorporated Adaptive coefficient scanning in video coding
KR101379187B1 (ko) 2008-06-23 2014-04-15 에스케이 텔레콤주식회사 블록 변환을 이용한 인트라 예측 방법 및 장치와 그를이용한 영상 부호화/복호화 방법 및 장치
JP4937224B2 (ja) 2008-09-30 2012-05-23 株式会社東芝 画像符号化装置
KR101247923B1 (ko) 2008-10-03 2013-03-26 퀄컴 인코포레이티드 4×4 및 8×8 보다 큰 변환을 이용한 비디오 코딩
US8483285B2 (en) * 2008-10-03 2013-07-09 Qualcomm Incorporated Video coding using transforms bigger than 4×4 and 8×8
US8503527B2 (en) * 2008-10-03 2013-08-06 Qualcomm Incorporated Video coding with large macroblocks
US20100098156A1 (en) * 2008-10-16 2010-04-22 Qualcomm Incorporated Weighted prediction based on vectorized entropy coding
US8611435B2 (en) * 2008-12-22 2013-12-17 Qualcomm, Incorporated Combined scheme for interpolation filtering, in-loop filtering and post-loop filtering in video coding
EA201690320A3 (ru) 2009-04-08 2016-10-31 Шарп Кабусики Кайся Устройство кодирования видеокадров и устройство декодирования видеокадров
KR101456498B1 (ko) * 2009-08-14 2014-10-31 삼성전자주식회사 계층적 부호화 단위의 스캔 순서를 고려한 비디오 부호화 방법 및 장치, 비디오 복호화 방법 및 장치
JP5562346B2 (ja) 2009-10-20 2014-07-30 シャープ株式会社 動画像符号化装置、動画像復号装置、動画像符号化方法および動画像復号方法
KR101841783B1 (ko) * 2009-12-04 2018-03-23 톰슨 라이센싱 비디오 인코딩 및 디코딩에서 인터 프레임을 위한 개선된 색차 변환을 위한 방법 및 장치
KR101700358B1 (ko) * 2009-12-09 2017-01-26 삼성전자주식회사 영상의 부호화 방법 및 장치, 그 복호화 방법 및 장치
WO2011083573A1 (ja) 2010-01-07 2011-07-14 株式会社 東芝 動画像符号化装置及び動画像復号化装置
KR101503269B1 (ko) 2010-04-05 2015-03-17 삼성전자주식회사 영상 부호화 단위에 대한 인트라 예측 모드 결정 방법 및 장치, 및 영상 복호화 단위에 대한 인트라 예측 모드 결정 방법 및 장치
US20110249743A1 (en) 2010-04-09 2011-10-13 Jie Zhao Super-block for high performance video coding
CN103141103B (zh) 2010-04-09 2016-02-03 Lg电子株式会社 处理视频数据的方法和装置
KR20160093105A (ko) 2010-04-23 2016-08-05 엠앤케이홀딩스 주식회사 영상 부호화 장치 및 방법
US8344917B2 (en) * 2010-09-30 2013-01-01 Sharp Laboratories Of America, Inc. Methods and systems for context initialization in video coding and decoding
US8494290B2 (en) * 2011-05-05 2013-07-23 Mitsubishi Electric Research Laboratories, Inc. Method for coding pictures using hierarchical transform units

Also Published As

Publication number Publication date
JP2016201808A (ja) 2016-12-01
JP2014530537A (ja) 2014-11-17
WO2013039908A2 (en) 2013-03-21
CN103797801A (zh) 2014-05-14
US20130136175A1 (en) 2013-05-30
EP2756676A2 (en) 2014-07-23
KR101671080B1 (ko) 2016-10-31
WO2013039908A3 (en) 2013-05-10
EP2756676B1 (en) 2022-10-19
US9787982B2 (en) 2017-10-10
CN103797801B (zh) 2017-10-17
KR20140049098A (ko) 2014-04-24

Similar Documents

Publication Publication Date Title
JP6022579B2 (ja) ビデオ・コーディングにおける非正方形変換ユニットおよび予測ユニット
JP5886440B2 (ja) イントラ予測ビデオコーディングにおける非正方形変換
JP6325068B2 (ja) サンプル適応オフセットのためのオフセットタイプおよび係数シグナリング方法
JP6174123B2 (ja) ビデオコーディングにおける量子化パラメータ(qp)コーディング
JP6254136B2 (ja) 統合されたマージモードおよび適応動きベクトル予測モード候補選択
JP5922244B2 (ja) ビデオコーディングにおいて適応ループフィルタとマージされたサンプル適応オフセット
JP5922245B2 (ja) クロマ成分のための適応ループフィルタ処理
JP5797840B2 (ja) ビデオコーディングのための並列化フレンドリーなマージ候補
JP6445001B2 (ja) ビデオコーディングプロセスにおける係数レベルコーディングのためのライスパラメータ初期化
JP5996661B2 (ja) イントラ予測コーディングのための最も可能性の高い変換
JP5784830B2 (ja) ビデオコード化のための複数領域走査順序
JP6105048B2 (ja) ビデオコーディングのための変換係数のコーディングにおけるグループフラグ
JP2015164328A (ja) 隣接モードを使用したビデオコーディングのための拡張イントラ予測モードシグナリング
JP2015502093A (ja) イントラモードコーディングにおける参照モード選択
RU2574280C2 (ru) Выбор единых кандидатов режима слияния и адаптивного режима предсказания вектора движения

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20150427

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20150512

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20150806

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20160223

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20160622

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20160630

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20160906

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20161005

R150 Certificate of patent or registration of utility model

Ref document number: 6022579

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees