JP6709823B2 - ビデオ符号化のための成分間相関解除 - Google Patents

ビデオ符号化のための成分間相関解除 Download PDF

Info

Publication number
JP6709823B2
JP6709823B2 JP2018101439A JP2018101439A JP6709823B2 JP 6709823 B2 JP6709823 B2 JP 6709823B2 JP 2018101439 A JP2018101439 A JP 2018101439A JP 2018101439 A JP2018101439 A JP 2018101439A JP 6709823 B2 JP6709823 B2 JP 6709823B2
Authority
JP
Japan
Prior art keywords
component
bit depth
act
inverse
original
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2018101439A
Other languages
English (en)
Other versions
JP2018160911A (ja
JP2018160911A5 (ja
Inventor
シアオユー シウ
シアオユー シウ
イエ イエン
イエ イエン
ユーウェン ホー
ユーウェン ホー
Original Assignee
ヴィド スケール インコーポレイテッド
ヴィド スケール インコーポレイテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ヴィド スケール インコーポレイテッド, ヴィド スケール インコーポレイテッド filed Critical ヴィド スケール インコーポレイテッド
Publication of JP2018160911A publication Critical patent/JP2018160911A/ja
Publication of JP2018160911A5 publication Critical patent/JP2018160911A5/ja
Application granted granted Critical
Publication of JP6709823B2 publication Critical patent/JP6709823B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/186Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a colour or a chrominance component
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/42Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation
    • H04N19/43Hardware specially adapted for motion estimation or compensation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/42Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation
    • H04N19/436Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation using parallelised computational arrangements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Computing Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Description

本発明は、ビデオ符号化に関する。
関連出願の相互参照
本出願は、参照によりその内容が本明細書に組み込まれている、2014年9月12日に出願した米国特許仮出願第62/049,843号明細書、および2015年6月5日に出願した米国特許仮出願第62/171,542号明細書の利益を主張するものである。
ビデオ符号化システムは、デジタルビデオ信号を圧縮して記憶要件および/または送信帯域幅を低減するために広く用いられる。種々のタイプのビデオ符号化システムは、ブロックベース、ウェーブレットベース、オブジェクトベースおよびブロックベースハイブリッドビデオ符号化システムを含む。ブロックベースのビデオ符号化システムは、MPEG1/2/4 part 2、H.264/MPEG−4 part 10 Advanced Video Coding(MPEG−4 AVC)、VC−1および高効率ビデオ符号化(HEVC)/H.265標準など、国際的なビデオ符号化標準に基づき得る。いくつかのブロックベースのビデオ符号化システムは、複雑なおよび/または非効率なアーキテクチャ上および動作上の実装を有する場合があり、準最適な符号化を生成し得る。
ビデオ符号化システム、例えばHEVCにおいて、成分間予測(CCP:cross component prediction)および適応型色変換(ACT:adaptive color transform)符号化は、同時に行われ得る。ACTは、変換ユニット(TU)レベルで適応的にイネーブルおよび/またはディセーブルされ得る。複数の色空間が、符号化ユニット(CU)内のTUの残差を符号化するために用いられ得る。例えばCU内のいくつかのTUは元の色空間において符号化され得、CU内のいくつかTUは変換された色空間において符号化され得る。
デコーダなどのビデオ符号化デバイスは、特定のTUに対して逆ACTを行うかどうかを決定することができる。決定はTUに対してACTがイネーブルされるかどうかに基づくことができる。TUに対してACTがイネーブルされる場合は、デコーダはTUに対して逆ACTを適用することができる。
ACTがTUに対してイネーブルされるかどうかは、TUレベルシグナリングに基づいて決定され得る。例えばACTが特定のTUに対してイネーブルされるかどうかは、CUに関連付けられた、またはTUを備える予測ユニット(PU)に関連付けられた、予測モード、パーティションモードおよびイントラ予測モードなどの1または複数の条件に基づいて決定され得る。例えばTUレベルシグナリングは、第1のTUに対して逆ACTが行われることになるかを示すことができ、第2のTUに対して逆ACTが行われることになるかを別個に示すことができる。TUを備えたCUに関連付けられた予測モードがインター予測であるという条件で、TUに対してACTがイネーブル/ディセーブルされ得ることが決定され得る。パーティションモードが2N×2Nであり、TUを備えたCUに関連付けられたイントラ彩度予測モードが4などの所定の値であるという条件で、TUに対してACTがイネーブル/ディセーブルされ得ることが決定され得る。パーティションモードがN×Nであり、TUに関連付けられたCUを備えたPUに対するイントラ彩度予測モードが4などの所定の値のものであるという条件で、TUに対してACTがイネーブル/ディセーブルされ得ることが決定され得る。他の場合に対して、ACTはディセーブルされることが決定され得る。
ACTがTUに対してイネーブルされるとの決定の後すぐにデコーダは、TUの残差を復号するための色空間を識別することができる。識別は、TUに関連付けられたTU色空間インジケータに基づくことができる。デコーダは、TUに関連付けられたTU色空間インジケータに基づいて、TUの残差が変換された色空間または元の色空間において符号化されたかを決定し、識別された色空間に基づいてTUの残差を復号することができる。デコーダは、ACTがイネーブルされた、CU内の各個別のTUに対するTU残差を復号するために用いられる色空間を識別することができる。
量子化解除時に複数のTUは、独立の並列処理経路によって処理され得る。例えば第1の並列処理経路は、第1のTUに対する量子化解除、逆変換、逆CCP、および第1のTUに対するTUレベルシグナリングにより示される場合は逆ACTを行うことができる。第2の、および独立の並列処理経路は、第2のTUに対する量子化解除、逆変換、逆CCP、および第2のTUに対するTUレベルシグナリングにより示される場合は逆ACTを行うことができる。2つの処理経路は互いに独立とすることができ、並列に行われ得る。
CCPおよびACT符号化ツールは、ロッシーおよびロスレス符号化に対して同じレベルでイネーブルおよびディセーブルされ得る。逆CCPおよび逆ACTは、ACT有効化/無効化がTUレベルで生じるかどうかに関わらず、TUレベルで動作され得る。TUの予測残差は、PUまたはCU全体の輝度および彩度残差の復元を待たずに、元の色空間に変換され得る。逆CCPおよび逆ACT変換は、組み合わされた復号プロセスにおいて行われ得る。TUレベルでの逆ACT、および組み合わされたCCPおよびACT復号プロセスを行うことは、TUレベルACT有効化/無効化を用いてまたは用いずに適用され得る。
適応型CCPのための重み付けパラメータの許容範囲は、動的に調整され得る。例えば重み付けパラメータαの許容範囲は、CCPがACTと一緒にイネーブルされたときは、2つの彩度成分に対して別個に調整され得る。αCgおよびαCoの許容範囲は、それらが異なる範囲を有するように調整され得る。
YCgCo領域において用いられる量子化パラメータ(QP)値は、選択されたCCPパラメータに基づいて調整され得る。調整は、逆CCPおよび逆色空間変換後の残差信号の歪みが、YCgCo空間における残差信号の歪みと同様となるように行われ得る。
ACTは、輝度成分および彩度成分のビット深度が異なるときは、選択的にディセーブルされ得る。残差信号における輝度および彩度成分のビット深度は、CCPの成分出力にビットシフトを適用することなどにより、残差信号の成分をスケーリングすることによって整列され得る。輝度成分および彩度成分のビット深度は、例えば逆色変換の前に左ビットシフトを通じて、他方の成分のビット深度に適合するように、より小さな/より低いビット深度により成分をスケーリングすることによって整列され得る。例えば輝度成分のビット深度は、輝度成分および彩度成分のビット深度間のビット深度差に基づいて、調整され得る。例えば彩度成分のビット深度は、輝度成分および彩度成分のビット深度間のビット深度差に基づいて調整され得る。スケーリングされた成分は、逆色変換の後、右ビットシフトを通じて、その元のビット深度に再調整および/または再スケーリングされ得る。
残差信号の成分のQPは、調整され得る。スケーリングされた成分は、出力の前に再調整および/または再スケーリングされ得る。例えばビデオ符号化システムの逆色変換の成分出力に、ビットシフトが適用され得る。
エンコーダは、所与のCUに対して、TUレベルでACTをイネーブルするかどうかを決定することができる。決定は、CU内のTUの残差が、非常に異なる統計的特性を有するかどうか、および/または差異の程度に基づくことができる。ACTをTUレベルでイネーブルおよび/またはディセーブルする決定の後すぐにエンコーダは、現在のCUの残差が複数の色空間において符号化され得ることを示すように、ACTイネーブルインジケータの値を設定することができる。エンコーダはTUの残差を符号化するための色空間を決定することができる。例えばエンコーダは、CU内の各TUに対する色空間を選択することができる。エンコーダは、選択された色空間を示すようにTU色空間インジケータを設定し、選択された色空間においてTUの残差をエンコードすることができる。
デコーダは、ビットストリームにおいてシグナリングされるインジケータに基づいて、ACTがCUに対してTUレベルでイネーブルおよび/またはディセーブルされるかどうかを決定することができる。インジケータは、CUに対するACTイネーブルインジケータを含むことができる。ACTがTUレベルでディセーブルされるとの決定の後すぐにデコーダは、CUに関連付けられたCU色空間インジケータに基づいて、CU内のTUの残差を復号するための色空間を識別することができる。
これらおよび他の技法は、プロセッサおよびコンピュータ可読記憶媒体を含み得るデバイス、例えばエンコーダ、デコーダによって、ハードウェア、ソフトウェア、および/またはファームウェアにおいて実施され得る。
例示のブロックベースのハイブリッドビデオエンコーディングシステムを示す図である。 例示のブロックベースのビデオデコーダを示す図である。 逆CCPおよび逆ACTを用いた例示のブロックベースのビデオデコーダを示す図である。 CCPパラメータの例示の非一様量子化を示す図である。 TUレベルで逆CCPを適用し、CUレベルで逆ACTを適用する例示の復号プロセスのタイミング図である。 TUレベルで逆CCPおよび逆ACTの両方を適用する例示の残差復号プロセスのタイミング図である。 CCPおよびACT動作の例示の連結を示す図である。 TUレベルでの逆CCPおよび逆ACTを組み合わせた例示の残差復号プロセスを示す図である。 ロッシー符号化におけるCo成分に対するCCPパラメータの例示のエンコーダ側量子化を示す図である。 ロスレス符号化におけるCg成分に対するCCPパラメータの例示のエンコーダ側量子化を示す図である。 ロスレス符号化におけるCo成分に対するCCPパラメータの例示のエンコーダ側量子化を示す図である。 ロッシー符号化において輝度および彩度のビット深度が異なるときに、ビット深度整列を用いて逆ACTを適用する例示の復号プロセスを示す図である。 ロッシー符号化において輝度および彩度のビット深度が異なるときに、量子化パラメータ(QP)調整を用いて逆ACTを適用する例示の復号プロセスを示す図である。 ロッシー符号化において輝度および彩度のビット深度が異なるときに、彩度逆変換の後に左ビットシフトを用いて逆ACTを適用する例示の復号プロセスを示す図である。 ロッシー符号化において輝度および彩度のビット深度が異なるときの、組み合わされた逆CCPおよび逆ACTにおける例示の復号プロセスを示す図である。 1または複数の開示される実施形態が実施され得る、例示の通信システムのシステム図である。 図13Aに示される通信システム内で用いられ得る、例示の無線送受信ユニット(WTRU)のシステム図である。 図13Aに示される通信システム内で用いられ得る、例示の無線アクセスネットワークおよび例示のコアネットワークのシステム図である。 図13Aに示される通信システム内で用いられ得る、他の例示の無線アクセスネットワークおよび例示のコアネットワークのシステム図である。 図13Aに示される通信システム内で用いられ得る、他の例示の無線アクセスネットワークおよび例示のコアネットワークのシステム図である。
例示的実施形態の詳細な説明が、様々な図に関連して述べられる。この説明は可能な実装形態の詳細な例をもたらすが、詳細は例示的なものであり、本出願の範囲を限定するものでは全くないことが留意されるべきである。
図1は、例示のブロックベースのハイブリッドビデオエンコーディングシステムを示す。示されるように入力ビデオ信号2はブロックごとに処理され得る。ブロックはマクロブロック(MB)と呼ばれ得る。高効率ビデオ符号化(HEVC)においては、符号化ユニット(CU)と呼ばれる拡張ブロックサイズが、高い解像度、例えば1080p以上の解像度を有するビデオ信号を圧縮するために用いられ得る。CUは例えば64×64画素(pixel)とすることができる。CUは予測ユニット(PU)にさらに区分化されることができ、それらに対して別個の予測方法が適用され得る。
図1に示されるように入力ビデオブロック(例えばMBおよび/またはCU)は、空間的予測60および/または動き/時間的予測62によって分析され得る。空間的予測は、入力ビデオ信号2に固有の空間的冗長性を低減することができる。時間的予測は、入力ビデオ信号2に固有の時間的冗長性を低減することができる。空間的予測は、イントラ予測と呼ばれ、例えば基準画像記憶部64からの、同じビデオ画像/スライスにおける既に符号化された隣接したブロックからの画素を用いて、現在のビデオブロックを予測する。時間的予測は、インター予測または動き補償された予測と呼ばれ、例えば基準画像記憶部64からの、既に符号化されたビデオ画像からの画素を用いて、現在のビデオブロックを予測することができる。
所与のビデオブロックに対する時間的予測は、1または複数の動きベクトルによってシグナリングされ得る。動きベクトルは、現在のブロックとその基準ブロックとの間の動きの大きさ/量および方向を示すことができる。MPEG−4 AVCまたはHEVCなどの複数の基準画像/ブロックがサポートされるときは、例えば基準画像記憶部64内のどの基準画像が時間的予測を行うために用いられたかを識別するために、ビデオブロックに対して基準画像インデックスが提供され得る。
モード決定ブロック80は、さらなる処理において用いられる予測ブロックを決定するために、予測モード(空間的または時間的などの)を選択することができる。例えばレート歪み最適化に基づいて、最良の予測モードが選択され得る。現在のビデオブロックから予測ブロックを減算する16ことによって、差分または残差が生成され得る。予測残差は、変換4によって相関解除され、量子化6によって目標ビットレートを達成するように量子化され得る。量子化された残差係数ブロックは、逆量子化10され、逆変換12されて復元された残差を生成し得る。復元された残差は、予測ブロックに加算され26、復元されたビデオブロックを形成し得る。復元されたビデオブロックに、ループフィルタ66、例えばブロック化解除フィルタおよび適応型ループフィルタ(ALF)が適用され得る。基準画像記憶部64は、フィルタリングされた(またはフィルタリングされない)復元されたビデオブロックを記憶することができ、これは将来のビデオブロックを符号化するために用いられ得る。
符号化モード(インターまたはイントラ)、予測モード情報、動き情報および量子化された残差係数ブロックは、エントロピー符号化ユニット8に提供され得る。エントロピー符号化ユニット8は、追加の圧縮を提供して、出力ビデオビットストリーム20を生成することができる。
図2は例示のブロックベースのビデオデコーダを示す。復号ユニット208は、ビデオビットストリーム202を受信し、アンパックし、エントロピー復号することができる。復号ユニット208は、残差係数を生成することができる。予測ブロック255は、ビットストリーム202のエンコーディングに基づいて生成され得る。ビットストリーム202がイントラ符号化されている場合、空間的予測ユニット260に、符号化モードおよび予測情報が提供され得る。ビットストリーム202がインター符号化されている場合、時間的予測ユニット262に符号化モードおよび予測情報が提供され得る。残差変換係数は、残差ブロックを復元するために、逆量子化ユニット210および逆変換ユニット212に提供され得る。予測ブロック255を残差ブロックに加算する226ことによって、復元されたブロックが生成され得る。復元されたブロックはループフィルタ266によってフィルタリングされ得る。フィルタリングされた(またはフィルタリングされない)復元されたブロックは、基準画像記憶部264に記憶され得る。基準画像記憶部264内の復元されたビデオは、空間的予測260および動き補償された予測262によって利用され、予測ブロック255を生成することができる。基準画像記憶部264内の復元されたビデオは、表示装置に提供され得る。
HEVCおよび他のブロックベースのビデオ符号化システムによって提供される、符号化/復号の効率および品質は、コンテンツにより変化し得る。例えばカメラによって捕捉された自然のビデオは、コンピュータ生成されたまたはスクリーンコンテンツとは実質的に異なる特性を有し得る。自然のビデオに対するHEVCの符号化効率は、通常はテキストおよびグラフィックスなどのコンピュータ生成されたコンテンツから構成されるスクリーンコンテンツビデオに対する符号化効率より、実質的に良好である。
スクリーンコンテンツビデオは、4:4:4彩度フォーマットにおいて捕捉されることができ、3つの色成分(輝度成分および両方の彩度成分など)は同じ解像度を有する。4:4:4彩度フォーマットは、4:2:0彩度フォーマットおよび4:2:2彩度フォーマットより多くの冗長性を結果として生じるので効率が低いが、4:4:4彩度フォーマットは、復号されたスクリーンコンテンツビデオにおいて、シャープエッジなどの色情報を保つために高忠実度が望まれ得るいくつかのスクリーンコンテンツアプリケーションによって好まれ得る。
例えば4:4:4彩度フォーマットビデオの3つの色成分、例えばYCbCr領域におけるY、Cb、Cr、およびRGB領域におけるG、B、Rの間の相関が活用され得る。
HEVCにおけるスクリーンコンテンツ符号化に関して、成分間予測(CCP)および適応型色変換(ACT)などの符号化ツールは、4:4:4彩度フォーマットビデオにおける3つの色成分の間の相関を活用するように使用され得る。例えばACTおよびCCPは共に残差領域において動作し得る。CCPは、輝度残差から彩度残差を予測するために用いられ得る。RGB空間においてG成分の残差は、BおよびRの残差を予測するために用いられることができ、YCbCr空間においてY成分の残差は、CbおよびCr成分の残差を予測するために用いられ得る。ACTでは3つの成分の残差は、3つの成分の間の相関(例えば冗長性)を低減するために、1つの色空間から別の色空間に変換され得る。
図3は、逆CCPおよび逆ACTを用いた例示のブロックベースのビデオデコーダを示す。復号における成分間相関解除は、4:4:4彩度フォーマットビデオの3つの色成分の間の冗長性を除去することができる。図3に示されるように残差復号プロセスは、逆CCP350、および逆色変換355、例えば逆ACTを含み得る。ビットストリーム302は、エントロピー復号308において復号され得る。逆CCPおよび/または逆ACT変換を適用するために、逆CCP350および/または逆色変換355を選択するように制御信号、例えば逆CCP制御および逆色変換制御が提供され得る。
エントロピー復号308によって提供された残差係数330は、量子化解除310および逆変換312によって処理され、残差ブロックを復元することができる。制御信号に応じて逆CCP350および/または逆色変換355が、残差ブロックの変換ユニット(TU)に適用され得る。逆CCPが選択された場合、TUの残差係数330は逆CCP350に提供され得る。1つの彩度成分(GBRビデオフォーマットにおけるBおよびR成分)の残差は、輝度成分(GBRビデオフォーマットにおけるG成分)の残差から予測され得る。逆ACTがCUまたはPUに対して選択された場合、CUまたはPUの残差係数330は、逆色変換355によって元の色空間に戻るように変換され得る。
復元されたブロックは、ループフィルタ366によってフィルタリングされ得る。フィルタリングされた(またはフィルタリングされない)復元されたブロックは、基準画像記憶部364に記憶され得る。基準画像記憶部364内の復元されたビデオは、予測ブロック340を生成するために、空間的予測362および/または時間的予測360によって利用され得る。基準画像記憶部364内の復元されたビデオは表示装置に提供され得る。
逆CCP350および逆色変換355は、異なるレベルで動作される2つの別個の復号プロセスとすることができる。例えば逆CCP350はTUレベルで動作することができ、逆色変換355はCUレベルでまたはPUレベルで動作することができる。例えば逆CCP350はTUレベル動作とすることができ、逆色変換はCUレベル/PUレベル動作とすることができる。
本明細書での実施形態を述べるために例として4:4:4ビデオの符号化が用いられ得るが、本明細書で述べられる技法は、多様なフォーマットにより動作可能な多様な符号化技法に適用可能である。
適応型成分間予測は、1または複数のブロックベースの符号化システム、例えばHEVCに適用可能である。予測は、輝度残差および/または彩度残差の間で行われ得る。予測値は、乗算およびビットシフトを含む簡単な動作を用いて生成され得る。彩度残差は、式1に従ってエンコーダ側で輝度残差を用いて予測され得る。
ΔrC(x,y)=rC(x,y)−α×r’L(x,y) 式1
デコーダ側では彩度残差は、式2に従って輝度残差から補償され得る。
r’C(x,y)=Δr’C(x,y)+α×r’L(x,y) 式2
式1および式2においてrCは位置(x,y)における元の彩度残差サンプルを示し、r’Lは輝度成分の復元された残差サンプルを表し、ΔrCは予測の後の予測された信号を表し、Δr’CはΔrCを符号化および復号した(例えば変換および/または量子化に続き、逆変換および/または逆量子化)後の復元された彩度残差を表し、r’Cは復元された彩度残差信号を表し、αは実数値の数である重み付けパラメータである。
αは浮動小数点精度を有する係数として導き出され得ることを考えれば、それはエンコーダからデコーダへの送信の前に量子化され得る。例示のCCPエンコーダでは、αの絶対値を量子化するために非一様量子化方法が利用され得る。
図4は、CCPパラメータの例示の非一様量子化を示す。図4に示されるようにαの絶対値(αは正または負となり得る)は、予め定義された値のセット{0,1/8,1/4,1/2,1}に量子化される。
表1は、元のα値と、例示の量子化プロセスを用いた復元値との間の例示的なマッピングを示す。
整数演算を用いたとき、予め定義された実数値は、整数スケーリングβを乗算すること、および3ビット右シフトによって近似され得る。それに対応して、式1および式2は、それぞれ式3および式4となり得る。
ΔrC(x,y)=rC(x,y)−(β×r’L(x,y))≫3 式3
r’C(x,y)=Δr’C(x,y)+(β×r’L(x,y))≫3 式4
式3および式4においてβは、{−8,−4,−2,−1,0,1,2,4,8}から選ばれる。輝度成分および彩度成分のビット深度が異なる場合は、輝度残差の大きさは、予測値として用いられる前に彩度残差のそれと整合するようにスケーリングされ得る。
ループ内適応型色空間変換は、3つの色成分の間の相関(例えば冗長性)が低減され得るように1つの色空間からYCgCo空間に残差を適応的に変換するように行われ得る。YCgCoへの色空間変換は、CUレベルで適応的に適用され得る。CUがロスレスモードでまたはロッシーモードで符号化されるかどうかに応じて、異なる色空間変換が適用され得る。例えばロッシーモードに対する順方向および逆色空間変換は、式5に従ったYCgCo変換の非可逆バージョンとなり得る。
ロスレスモードに対しては、YCgCo変換の可逆バージョンが行われ得る。変換は、式6で以下に示されるようにリフティング動作に基づいて実施され得る。
式5に示されるように、ロッシーモードで用いられる順方向および逆色変換行列は、正規化され得ない。YCgCo信号の大きさは、色変換が適用された後に元の信号の大きさと比べて小さくなり得る。順方向色変換によって引き起こされる大きさの減少を補償するために、調整された量子化パラメータが、YCgCo領域における残差に適用され得る。例えばYCgCo領域残差を量子化するために、QP値QPY、QPCgおよびQPCoが用いられ得る。色空間変換が適用されるとき、QP値QPY、QPCgおよびQPCoは、それぞれQP−5、QP−5、およびQP−3に設定され得る。QPは、元の色空間において用いられる量子化パラメータとすることができる。
ACTおよびCCPは、異なるレベルでイネーブルまたはディセーブルされ得る。ACTツールがCUレベルでイネーブル/ディセーブルされ、予測残差の変換符号化はTUレベルで適用され得ると仮定する。1つのCUの残差は、4分木構造に基づいて複数のTUに区分化され得る。TUの残差は、同じCU内の隣接したTUの残差とは異なる特性を有し得る。CU内のTUは、同じACT決定を用い得る(例えばCUレベルでイネーブルまたはディセーブルするように)。
ACTおよびCCPは、同じレベルでイネーブルまたはディセーブルされ得る。例えばACTの有効化/無効化は、TUレベルでのものとすることができる。
ACTシグナリングフラグ、例えばcu_ycgco_coding_flagは、色空間変換が適用されるかどうかを示すことができる。ACTシグナリングフラグは、CUレベルでシグナリングされ、色空間変換が、現在のCUなどの対応するCUに適用されるかどうかを示すことができる。例えば1の値を有するcu_ycgco_coding_flagは、対応するCUの残差は、YCgCo空間においてエンコード/復号されることを示すことができる。0の値を有するcu_ycgco_coding_flagは、CUの残差が元の色空間においてエンコード/復号されることを示すことができる。イントラブロックコピー(IBC)モードおよびインターモードに対してこのようなフラグは、現在のCU内に少なくとも1つの非ゼロ係数があるときにシグナリングされ得る。
予測残差の変換符号化において、残差ブロックは複数の正方形のTUに区分化され得る。可能なTUサイズは、4×4、8×8、16×16および32×32を含み得る。ビデオ特性および選択された符号化モードに応じて、CU内の隣接したTUは、場合によっては非常に異なる統計的特性をもつ残差信号を有し得る。ACTは、TUレベルで適応的にイネーブルおよび/またはディセーブルされ得る。複数の色空間が、CU内のTUの残差を符号化するために用いられ得る。CU内の異なるTUは、異なる色空間において符号化され得る。
エンコーダは、CUに対してTUレベルでACTをイネーブルおよび/またはディセーブルするかどうかを決定することができる。決定は、CU内のTUの残差が、非常に異なる統計的特性を有するかどうかに基づく(例えば差異の程度に基づく)ことができる。ACTをTUレベルでイネーブルする決定の後すぐにエンコーダは、現在のCU(例えば現在のCUの残差)が複数の色空間において符号化され得ることを示すように、ACTイネーブルインジケータの値を設定することができる。TUレベルでACTをディセーブルする決定の後すぐにエンコーダは、現在のCUが単一の色空間において符号化されることを示すように、ACTイネーブルインジケータの値を設定することができ、色空間を示すようにインジケータを設定することができる。デコーダは、ACTがCUに対してTUレベルでイネーブルおよび/またはディセーブルされるかどうかを決定することができる。決定は、CUのためのACTイネーブルインジケータなどのシグナリングされるインジケータに基づくことができる。ACTがTUレベルでディセーブルされるとの決定の後すぐにデコーダは、CUに関連付けられたCU色空間インジケータに基づいて、CU内のTUの残差を復号するための色空間を識別することができる。
表2は、符号化ユニット構文の非限定的な例を示す。表2に示されるようにACTイネーブルインジケータなどのインジケータは、CUレベルでシグナリングされ得る。インジケータは、色空間の間(または複数の色空間の間)の選択が、対応するCU内のTUに対して実行され得るかどうかを示すことができる。インジケータは、tu_act_enabled_flagを含み得る。例えばtu_act_enabled_flagが0に設定されている場合は、それは現在のCUの残差が1つの色空間において符号化されることを示すことができる。色空間は、表2に示されるcu_ycgco_coding_flagなどのCU色空間インジケータによって示され得る。tu_act_enabled_flagが1に設定されている場合は、それは現在のCU内のTUは、それ自体の残差を符号化するために、2つの色空間の間(または元の色空間および変換された色空間などの複数の色空間の間)で選択するように柔軟性を有し得ることを示すことができる。
例えば1に等しいtu_act_enabled_flagは、現在のCU内のTUの残差は、異なる色空間において符号化され得ることを示すことができる。tu_act_enabled_flagが0に等しいとき、それは符号化ユニットの残差は、cu_ycgco_residual_flagによって指定される1つの色空間において符号化されることを示すことができる。
例えば1に等しいcu_ycgco_residual_flagは、CUの残差がYCgCo色空間において符号化され得ることを示すことができる。cu_ycgco_residual_flagが0に等しいとき、それは符号化ユニットの残差が元の色空間において符号化され得ることを示すことができる。
sps_residual_act_flagが0に等しい場合、cu_ycgco_residual_flagはなくてもよい。デコーダは、sps_residual_act_flagの値は0に等しいと推論することができる。sps_residual_act_flagが1に等しく、およびtu_act_enabled_flagが1に等しい場合は、cu_ycgco_residual_flagはなくてもよい。残差が符号化される色空間は、cu_ycgco_residual_flagによって指定され得ない。残差が符号化される色空間は、tu_ycgco_residual_flagによって指定され得る。
TUレベルでACTをイネーブルするとの決定の後すぐにエンコーダは、TUの残差を符号化するための色空間を決定することができる。例えばエンコーダは、CU内の各TUに対する色空間を選択することができる。エンコーダは、選択された色空間を示すようにTU色空間インジケータを設定することができ、選択された色空間においてTUの残差をエンコードすることができる。
ACTがTUレベルでイネーブルされるとの決定の後すぐにデコーダは、TUに関連付けられたTU色空間インジケータに基づいて、CU内のTUの残差を復号するための色空間を識別することができる。実施形態ではデコーダは、CU内の各個別のTUに対する、TU残差をエンコードするために用いられる色空間を識別することができる。デコーダは、そのTUに対して識別された色空間に基づいて、TUの残差を復号することができる。
表3は、変換ユニット構文の非限定的な例を示す。表3に示されるように、対応するTUのために選ばれた色空間を指定するために、transform_unit()内に、tu_ycgco_coding_flagなどのフラグが含まれ得る。フラグは、そのTUに対して少なくとも1つの非ゼロ係数があるときは、ビットストリームにおいてシグナリングされ得る。実施形態ではTUに対する係数がゼロであるときは、フラグはビットストリームにおいてスキップされ得る。
表3に示されるようにtu_ycgco_residual_flagなどのインジケータは、変換の残差がYCgCo色空間において符号化されるかどうかを示すことができる。例えば1に等しいtu_ycgco_residual_flagは、変換ユニットの残差はYCgCo色空間において符号化されることを示し得る。tu_ycgco_residual_flagが0に等しいときは、それは変換ユニットの残差は元の色空間において符号化されることを示し得る。tu_ycgco_residual_flagがないとき、それは0に等しいと推論され得る。
フラグtu_act_enabled_flagなどのインジケータは、ACTがイネーブルまたはディセーブルされたかを示すようにシグナリングされ得る。インジケータは、CUレベル、TUレベル、および/または他のレベルにおいてシグナリングされ得る。例えばインジケータが、ACTはTUレベルにおいてディセーブルされることを示す場合は(例えばフラグは0に等しい)、現在のCUの残差は同じ色空間において符号化され得る(例えばフラグcu_ycgco_residual_flagによって示されるように)。インジケータが、ACTはTUレベルにおいてイネーブルされることを示す場合は(例えばフラグは1に等しい)、CU内の個別のTUは、残差を符号化するためにそれ自体の色空間を選択することが許容され得る。同じCU内のTUの残差は、異なる色空間において符号化され得る。
ACTがTUに対してイネーブルされるかどうかは、TUレベルシグナリングに基づいて決定され得る。TUレベルシグナリングは、第1のTUに対して逆ACTが行われることになるかを示すことができ、第2のTUに対して逆ACTが行われることになるかを別個に示すことができる。例えばACTが特定のTUに対してイネーブルされるかどうかは、CU、またはTUを備える予測ユニット(PU)に関連付けられた、予測モード、パーティションモード、およびイントラ予測モードなどの1または複数の条件に基づいて決定され得る。表3−1は非限定的な例示の変換ユニット構文表を示す。
表3−1に示されるように、TUを備えたCUに関連付けられた予測モードがインター予測であるという条件で、TUに対してACTがイネーブル/ディセーブルされ得ることが決定され得る。パーティションモードが2N×2Nであり、TUを備えたCUに関連付けられたイントラ彩度予測モードが4などの所定の値であるという条件で、TUに対してACTがイネーブル/ディセーブルされ得ることが決定され得る。パーティションモードがN×Nであり、TUに関連付けられたCUを備えたPUに対するイントラ彩度予測モードが4などの所定の値のものであるという条件で、TUに対してACTがイネーブル/ディセーブルされ得ることが決定され得る。実施形態では他の場合に対して、ACTはディセーブルされることが決定され得る。
ACTがTUに対してイネーブルされるとの決定の後すぐにデコーダは、TUの残差を復号するための色空間を識別することができる。識別は、TUに関連付けられたTU色空間インジケータに基づくことができる。デコーダは、TUに関連付けられたTU色空間インジケータに基づいて、TUの残差が変換された色空間または元の色空間において符号化されたかを決定し、識別された色空間に基づいてTUの残差を復号することができる。デコーダは、ACTがイネーブルされた、CU内の各個別のTUに対するTU残差を復号するために用いられる色空間を識別することができる。
表3−1に示されるようにtu_ycgco_residual_flagなどのインジケータは、変換の残差がYCgCo色空間において符号化されるかどうかを示すことができる。例えば1に等しいtu_ycgco_residual_flagは、TUの残差がYCgCo色空間において符号化されることを示すことができる。実施形態では1に等しいインジケータtu_ycgco_residual_flagは、TUに対してACTがイネーブルまたはディセーブルされ得ることを示すことができる。tu_ycgco_residual_flagが0に等しいとき、それはTUの残差が元の色空間において符号化されることを示すことができる。tu_ycgco_residual_flagがないとき、それは0に等しいと推論され得る。
例えばフラグtu_ycgco_coding_flagなどのインジケータは、TUに対して色空間が適応的に選択され得るように、変換ユニット構文表においてシグナリングされ得る。例えば色空間は、各TUに対して選択され得る。フラグはシグナリングされ得る。フラグは、符号化されたブロックフラグ(CBF)が、1つのTUにおける係数がゼロである、またはDMモードを使用しない1つのイントラ符号化されたCU内に1または複数のPUがあることを示すときは、スキップされ得る。
色空間はCUに対して選択され得る。例えばACTをTUレベルでディセーブルする決定の後すぐにエンコーダは、変換された色空間および元の色空間のレート歪み(R−D)性能に基づいて、色空間を選択することができる。エンコーダは、変換された色空間および元の色空間のレート歪み(R−D)性能をテストすることができる。いくつかの符号化の場合に対して、テストされる色空間の数を減らすために1または複数のエンコーディング加速プロセスが適用され得る。例えばCU内のTUの残差が変換された色空間または元の色空間で符号化され得るかどうかは、CUレベルで決定され得る。R−D性能は、CU内のTUの残差を符号化するための異なる色空間を用いることによってテストされ得る。
本明細書では説明のために、「CUレベルACTオン」および「CUレベルACTオフ」という用語はそれぞれ変換された色空間(例えばACTをイネーブルする)および元の色空間(例えばACTをディセーブルする)においてCU内のTUの残差を符号化することを指し、「TUレベルACT」という用語はTUの残差を符号化するための色空間を別個に選択することを指し(例えばCU内の各TUはそれ自体の色空間を選択する自由を有する)、さらに「CUレベルACT」という用語は「CUレベルACTオン」または「CUレベルACTオフ」を指すことができる。
例えばTUレベルACTのR−Dコストが決定され得る。例えばCUレベルACTのR−Dコストが計算され得る。非限定的な例においてTUレベルACTのR−Dコストは、CUレベルACTのR−Dコストがチェックされる前にチェックされ得る。CUレベルACTに対してテストされることになる色空間の選択は、入力ビデオの色フォーマットに依存し得る。RGBシーケンスに対しては、CUレベルオンがテストされ得る。YUVシーケンスに対しては、CUレベルオフがテストされ得る。CUレベルACTのR−D性能チェックは、TUレベルACTに対して少なくとも1つの非ゼロ係数があるという条件で行われ得る。
符号化パラメータが決定され得る。実施形態では同じ符号化パラメータが、TUレベルACT、CUレベルACTおよび/または他のレベルでのACTに対して用いられ得る。例えばイントラモードに対しては、輝度および彩度成分のイントラ予測方向は、TUレベルACTおよびCUレベルACTによって共有され得る。例えばインターモードに対しては、動き情報(例えば動きベクトル、基準画像インデックスおよび動きベクトル予測値)は、TUレベルACTおよびCUレベルACTによって共有され得る。
大きなサイズ(例えば64×64および32×32)のCUはしばしば、残差符号化のために1つの特定の色空間を選択する可能性がより高い、画像内の平坦エリアを符号化するために選択され得る。小さなCUによってカバーされたエリアは、多様な特性を有し得るリッチテクスチャを含む可能性がより高い。イントラモードに対してTUレベルACTは、RGBシーケンスの8×8CU、並びにYUVシーケンスの16×16および8×8CUに対して検査され得る。実施形態においてTUレベルACTはイントラモードに対して、RGBシーケンスの8×8CU、並びにYUVシーケンスの16×16および8×8CUに対してのみ検査され得る。IBCモードに対してTUレベルACTは、16×16および8×8CUに対して検査され得る。実施形態においてTUレベルACTはIBCモードに対して、16×16および8×8CUに対してのみ検査され得る。インターモードに対してTUレベルACTは、8×8CUに対して検査され得る。実施形態においてTUレベルACTはインターモードに対して、8×8CUに対してのみ検査され得る。
子TUに対する色空間は、その親TUの色空間に基づいて選択され得る。例えば子TUに対する色空間は、その親TUの色空間から導き出され得る。RGBシーケンスに対して、RGB領域におけるR−Dコストの計算は、その親TUの残差がYUV空間において符号化される場合は、TUに対してスキップされ得る。YUVシーケンスに対して、YUV領域におけるR−Dコストの計算は、その親TUの残差がRGB空間において符号化されるという条件で、TUに対してスキップされ得る。
符号化された画像は異なる時間レイヤ(TL)に分類され得る。より低いTLにおける画像は、より良好なビデオ品質により符号化され得る。より高いTLにおける画像は、より低いTLにおける画像より、ビデオシーケンス全体のより大きな部分を占め得る。TUレベルACTのR−Dプロセスは、エンコーディング構成および/または符号化された画像のTLレベルに応じてスキップされ得る。例えばランダムアクセス(RA)構成に対して、イントラモードおよびIBCモードに対するTUレベルACTは、RGBシーケンスに対するTL−3画像に対しては検査されなくてもよい。例えばインターモードに対するTUレベルACTの検査は、RGBおよびYUVシーケンスに対するTL−0画像に対してはスキップされ得る。例えば低遅延(LD)構成に対して、イントラモードおよびIBCモードに対するTUレベルACTの検査は、RGBシーケンスに対するTL−0およびTL−1画像に対してはスキップされ得る。例えばインターモードに対するTUレベルACTの検査は、RGBに対するTL−0画像、並びにYUVシーケンスに対するTL−0およびTL−2画像に対してはスキップされ得る。例えばロスレス符号化が適用される場合、TUレベルACTは、イントラおよびIBCモードに対してディセーブルされ得る。
逆CCPおよび逆ACTは異なるレベルで行われ得る。ACT復号プロセスは、CUがイントラモード、IBCモードまたはインターモードで符号化されているかに応じて異なるレベルで実行され得る。イントラモードおよびIBCモードにより符号化されるCUに対して色空間変換は、PUレベルで行われ得る。インターモードにより符号化されるCUに対しては、色空間変換はCUレベルで行われ得る。結果として逆色変換は、1つのPUまたはCUにおけるTUの残差が復元されるまで、起動され得ない。
逆CCPおよび逆ACTはTUレベルで行われ得る。TUの予測残差は、PUまたはCU全体の輝度および彩度残差の復元を待たずに、元の色空間に変換され得る。例えば量子化解除において複数のTUは、独立の並列処理経路によって処理され得る。第1の並列処理経路は、第1のTUに対する量子化解除、逆変換、逆CCP、および第1のTUに対するTUレベルシグナリングによって示される場合は逆ACTを行うことができる。第2の、および独立の並列処理経路は、第2のTUに対する量子化解除、逆変換、逆CCP、および第2のTUに対するTUレベルシグナリングによって示される場合は逆ACTを行うことができる。2つの処理経路は互いに独立とすることができ、並列に行われ得る。
逆CCPおよび逆ACTモジュールは2つの別個の復号プロセスとして定義され得る。逆CCPおよび逆ACT変換は、組み合わされた復号プロセスにおいて行われ得る。TUレベルでの逆ACT、および組み合わされたCCP+ACT復号プロセスを行うことは、TUレベルACT有効化/無効化を用いてまたは用いずに適用され得る。
TUベースの逆色変換が行われ得る。逆色変換は異なるレベルで実行され得る。イントラモードおよびIBCモードにより符号化されたCUに対して逆色変換は、PUレベルで行われ得る。インターモードにより符号化されたCUに対して色空間変換は、CUレベルで行われ得る。逆CCPは、TUレベル動作として行われ得る。
図5Aおよび図5Bは、異なるレベルでの逆色変換の実行の、並列符号化に対する影響を視角的に説明する。図5Aは、TUレベルで逆CCPを適用し、CUレベルで逆ACTを適用する例示の復号プロセスのタイミング図である。図5Aは、CCPおよびACTの両方が適用されるときの、1つのCUにおける残差信号の復号プロセスを示す。簡略化された説明のためにCUは、それぞれ同じサイズを有する4つのTU、すなわちTU0、TU1、TU2およびTU3に区分化されると仮定する。また逆CCPはTU0およびTU2に適用されるが、TU1およびTU3には適用されないと仮定する。
図5Aにおいてブロックは、量子化解除および逆変換、逆CCPおよび逆色変換の復号時間を表す。ti inv-transquantおよびti inv-ccpはi番目のTUに対するそれぞれ、量子化解除および逆変換モジュール、並びに逆CCPモジュールの復号時間であり、tcu inv-actはCU全体の逆色変換のための復号時間である。逆CCPおよび逆色変換は共に画素ごとの動作であるので、対応する復号時間はそのTU内の画素の数におおよそ比例する。
図5Aに示されるように、逆CCPおよび逆色変換は異なるレベルで動作されるので、逆色変換は、CCPがイネーブルされたTUの逆CCPの後に開始される。例えばTU1は最も小さな残差復元時間を有するがその残差は、TU2の残差が復元される前には、元の色空間に戻るように変換され得ない。図5AでのCUの残差復号の合計時間は、式7に等しい。
逆色変換はTUレベルで行われ得る。TUの予測残差は、CU全体の輝度および彩度残差の復元を待たずに、元の色空間に戻るように変換され得る。
図5Bは、TUレベルで逆CCPおよび逆ACTの両方を適用する、例示の残差復号プロセスのタイミング図である。図5Bは、CCPおよびACTの両方が適用されるときの、1つのCUにおける残差信号の復号プロセスを示す。図5Aに対するものと同じ仮定が、図5Bに適用可能である。図5Bにおいてブロックは、量子化解除および逆変換、逆CCP、並びに逆色変換の復号時間を表し、ti inv-actはi番目のTUに対する逆色変換の復号時間である。ti inv-actは、図内の各TUがCUのサイズの4分の1であることを考えれば、おおよそtcu inv-act/4に等しい。
図5Bに示されるようにTUの残差は、逆CCPの直後に、YCgCo空間から元の色空間に変換され得る。対応する残差復号の合計時間は、式8に従って計算され得る。
逆CCPおよび逆ACT変換は、組み合わされた復号プロセスとして行われ得る。例えばACTおよびCCPは残差領域において実行されることができ、組み合わされた復号モジュールによって行われ得る。
式4に示されるように逆CCPは線形動作として書き表され、式9などの行列乗算に変形され得る。
式9においてY’、C’gおよびC’oは、逆CCP前のY、CgおよびCoの残差信号とすることができる。Y、CgおよびCoは、逆CCP後のY、CgおよびCoの残差信号とすることができる。βCgおよびβCoは、それぞれCgおよびCoのCCPパラメータとすることができる。
ロッシー符号化に対しては、式9の逆CCP、および式5の逆ACTの両方が線形動作であることを考えれば、逆CCPおよび逆ACTプロセスは、式10に示されるように乗算によって組み合わされ得る。
ロスレス符号化に対しては、式6のリフティングベースの逆ACTを前提として、CCPおよびACTの組み合わされた復号プロセスは、図6Aに示されるように2つの動作を連結することによって導き出され得る。
図6Bは、TUレベルでの逆CCPおよび逆ACTを組み合わせた例示の残差復号プロセスを示す。図6Bは、逆CCPおよび逆ACTが1つの組み合わされた復号モジュールに組み合わされた、図5Bに示される復号プロセスを示す。図6Bに示されるようにTUに対する復号プロセスは、量子化解除および逆変換プロセス、並びに組み合わされた逆CCPおよびACTプロセスを含み得る。示されるようにTU0に対して、量子化解除および逆変換プロセスを行うためにt0 inv-transquant、および組み合わされた逆CCPおよびACTプロセスを行うためにt0 combinedだけかかり得る。TU2に対しては、量子化解除および逆変換プロセスを行うためにt2 inv-transquant、および組み合わされた逆CCPおよびACTプロセスを行うためにt2 combinedだけかかり得る。復号待ち時間は、図5Bに示される3つのモジュールを用いる例示の残差復号プロセスと比べて低減され得る。
逆CCPおよびACTの組み合わされたモジュールは、逆CCPがオフにされた状態で逆ACTを行うことができる。例えば図5Bに示されるようにTU1およびTU3は、逆ACTを利用するが、逆CCPは利用しない。復号プロセスは、式10における対応するCCPパラメータβCgおよびβCoをゼロに設定することによって、組み合わされたモジュールを用いて実施され得る。組み合わされたモジュールは、逆ACT単独、およびCCPと組み合わされた逆ACTを達成するために利用され得ることを考えれば、デコーダは、別個の逆ACT専用モジュールを実施せずに、組み合わされたモジュールを含むことができる。
色空間変換の後、3つの色成分の本質的に異なるダイナミックレンジが存在し得る。3つの色成分のダイナミックレンジは、色空間変換の後にはもはや同一ではなくなり得る。式1および式2並びに表1に示されるようにαの値は、範囲[−1,1]に制限される。輝度成分および彩度成分は、同じダイナミックレンジを持つまたは持たない場合がある。式5および式6に示されるように、ロッシー符号化およびロスレス符号化において用いられる順方向色変換は、正規化され得ない。3つの成分(Y、CgおよびCo)の大きさは、異なるスケーリングファクタによって変化され得る。
適応型成分間予測のための重み付けパラメータの許容範囲は動的に調整され得る。αの許容範囲は、CCPがACTと一緒にイネーブルされたときは、2つの彩度成分に対して別個に調整され得る。αCgおよびαCoの許容範囲は、それらが異なる範囲を有することができるように調整され得る。
例えば式1および式2におけるパラメータαの許容範囲は、CCPがACTと一緒にイネーブルされたときは、2つの彩度成分に対して別個に調整され得る。Cg成分に対する重み付けパラメータαCgの許容範囲、およびCoに対する重み付けパラメータαCoの許容範囲が調整され得る。CgおよびCo成分に対する重み付けパラメータは、異なる範囲を有し得る。
式1および式2に示されるようにαの値は、範囲[−1,1]に制限され得る。輝度および彩度成分は同じダイナミックレンジを有する。式5における順方向色変換行列の行は、異なるノルムを示す場合があり、YCgCo空間において導き出されたαのダイナミックレンジは、元の色空間のものと異なるようになり得る。YCgCo色空間におけるCgおよびCo成分のα値の許容範囲は、成分の間のダイナミックレンジ差に基づいて調整され得る。
式5に示されるようにロッシー符号化に対して、順方向色変換行列の3つの行のノルムは式11によって与えられ得る。
式11を考察すると、YCgCo空間における各彩度成分および輝度成分の間の大きさ比は、式12に示されるように導き出され得る。
CgとYの間の相対的な大きさ比が1であることを考えれば、Cg成分に対するα値を制限するために、範囲[−1,1]が用いられ得る。Co成分に対しは、その信号の大きさが、ACTの後にY成分のそれより大きくなり得ることを考えれば、それのα値の範囲は[−1.15,1.15]に調整され得る。許容範囲は、Co成分とY成分の間の相対的な大きさ比(例えば式12に示されるような)に基づいて決定され得る。
エンコーダは、範囲調整の適用の後に、Co成分のα値を量子化することができる。図7は、ロッシー符号化におけるCo成分の例示のエンコーダ側量子化を示す。表4は、元のα値と、図7に示される量子化の例を用いたCo成分に対する復元値との間の非限定的な例示のマッピングを示す。
順方向および逆CCPに関して、実数のα値−1.15および1.15は、整数スケーリングを乗算し、右シフトすることによって近似され得る。例えば5ビット固定小数点近似を用いると、αが−1.15または1.15のとき、式3および式4は式13および式14となる。
ΔrC(x,y)=rC(x,y)−(37×r’L(x,y))≫5 式13
r’C(x,y)=Δr’C(x,y)+(37×r’L(x,y))≫5 式14
例において固定小数点近似の3ビット精度と一貫性を有して、実数のα値1.15および1.15は、式15および式16によって与えられるように、9のスケーリングの乗算、その後の3ビット右シフトによって近似され得る。
ΔrC(x,y)=rC(x,y)−(9×r’L(x,y))≫3 式15
r’C(x,y)=Δr’C(x,y)+(9×r’L(x,y))≫3 式16
ロスレス符号化に対しては、式6での順方向色変換のリフティング動作を行列動作に変形した後、YCgCo空間における彩度成分と輝度成分の大きさ比は、式17に示されるように導き出され得る。
ロッシー符号化におけるCo成分に対して、CgおよびCo成分に対するα値の許容範囲は、それぞれロスレス符号化において[−2,2]および[−2.3,2.3]に調整され得る。
図8Aおよび図8Bは、範囲調整を有するCgおよびCo成分のα値を量子化するために用いられる、例示のエンコーダ側量子化を示す。図8Aは、ロスレス符号化におけるCg成分の例示の量子化を示す。図8Bは、ロスレス符号化におけるCo成分の例示の量子化を示す。
表5は、元のα値と、ロスレス符号化に対して図8Aの量子化方法を用いたCg成分に対する復元値との間の非限定的な例示のマッピングを示す。
表6は、元のα値と、ロスレス符号化に対して図8Bに示される量子化を用いたCo成分の復元値との間の非限定的な例示のマッピングを示す。
図8Aおよび図8B、並びに表5および表6に示されるロスレス符号化の例によれば、範囲限界[−2,2]および表5における量子化プロセスはCg成分のα値に適用され、範囲限界[−2.3,2.3]および表6における量子化プロセスはCo成分のα値に適用され得る。
ロスレス符号化の例において、範囲限界[−2,2]および表5における量子化プロセスは、Cg成分およびCo成分の両方のα値に適用され得る。
ロッシー符号化およびロスレス符号化に対して、彩度成分のα値が調整され得る。元の復元値−1および1は、調整された範囲の境界値により置き換えられ得る。例えば元の復元値−1/1は、表4における−1.15/1.15によって、表5における−2/2によって、および/または表6における−2.3/2.3によって置き換えられ得る。
α値の範囲は、CCPに対する復元値のリストにおける追加の要素として、調整された範囲の境界値を追加することによって調整され得る。例としてロスレス符号化におけるCg成分のCCPを用いて表7は、元のα値と、増加された復元値の数を有する復元値との間のマッピングを示す。
表5と表7の比較は、増加された復元値の数を明らかにしている。表5では9個の復元値がある。表7では11個の復元値がある。表7は、範囲調整の前の復元値{1,−1/2,−1/4,−1/8,0,1/8,1/4,1/2,1}に、調整された境界値−2および2を追加することによって、復元値リストのサイズを11に増加している。増加された値のマッピングによる範囲調整は、ACTが適用されるときに、ロスレス符号化においてCgおよびCo成分の両方のために用いられ得る。
YCgCo領域において用いられる量子化パラメータ(QP)値は、例えばYCgCo空間における量子化誤差を元の色空間におけるものと同程度にするために、元の色空間において用いられるものとは異なって設定され得る。CCPプロセスは、信号の大きさを変化させ得る。
YCgCo空間において用いられるQP値は、選択されたCCPパラメータに基づいて調整され得る。調整は、逆CCPおよび逆色空間変換後の残差信号の歪みが、YCgCo空間における残差信号の歪みと同様となるように行われ得る。
式9に示されるようにCCPおよびACTが適用されるときは、組み合わされた行列のノルムは1に等しくならない場合がある。YCgCo色空間に適用されるQPは、元の色空間において適用されるQPとは異なり得る。CCPおよびACTが適用されるときはQP調整値は、CCPプロセスによって引き起こされる信号の大きさ変化を考慮するように調整され得る。
例えばYCgCo空間において用いられるQP値は、選択されたCCPパラメータを考慮することにより調整され得る。組み合わされた行列のノルムは、式18に示されるように導き出され得る。
量子化ステップサイズは、式19によって与えられる。
step=2(QP-4)/6 式19
量子化誤差は、
に関係する。元の色空間(例えばYCgCo空間から戻るように変換後)における信号の歪みは、YCgCo信号におけるものと同じレベルのものとなり得る。QP調整値は、式20によって与えられ得る。
式20においてQP0、QP1およびQP2は、元の色空間において3つの成分に適用されるQPとすることができる。式21は、式22のように整理され得る。
QP調整の例は、表4に示された前の例を参照して提供され、これはロッシー符号化におけるCo成分に対する、オリジナルの、および復元値をマッピングする。前の例のCCP範囲調整において、範囲限界[−1,1]および[−1.15,1.15]は、それぞれCgおよびCo成分のCCPパラメータに適用され得る。表8は、CCPパラメータ範囲調整によるβCoの値に応じた、Y成分に対する対応するQP調整ΔQPYを示す。βCoは、Co成分のCCPパラメータを表し得る。βCgは、Cg成分のCCPパラメータを表し得る。
CCPは範囲調整なしに適用され得る。例えばCg成分に対するCCPパラメータは、[−1,1]のまま調整されなくてもよく、および/または範囲調整プロセスは適用されなくてもよい。表9は、CCPの範囲調整の適用なしに、異なるCCPパラメータβCgおよびβCoを用いた、YCgCo色空間における例示の輝度QP調整ΔQPYを示す。βCgおよびβCoの両方の値は、{−8,−4,−2,−1,0,1,2,4,8}から選ばれ得る。表9は、βCgおよびβCoの値に基づく、Y成分に対する対応するQP調整ΔQPYを示す。
表8および表9のリストに記載されたQP調整値はロッシー符号化に適用可能である。QP調整は、量子化が適用されない場合は、ロスレス符号化に対してスキップされ得る。
ACTにおいて、彩度成分のビット深度は、輝度成分のビット深度とは異なり得る。彩度成分のビット深度は、BitDepthCとして表され得る。輝度成分のビット深度は、本明細書ではBitDepthYとして表され得る。
ACTは、BitDepthYとBitDepthCとが異なるときはスキップされ得る。ACTツールは、例えばハイレベルシグナリングによってディセーブルされるように構成され得る。例えば、BitDepthYとBitDepthCとが異なるときは、シーケンスパラメータセット(SPS)におけるフラグresidual_adaptive_colour_transform_enabled_flagは、0に設定され得る。
輝度成分および彩度成分のビット深度は、例えば逆色変換の前に左ビットシフトを通じて、他方の成分のビット深度に適合するように、より小さな/より低いビット深度により成分をスケーリングすることによって整列され得る。例えば輝度成分のビット深度は、輝度成分および彩度成分のビット深度のビット深度差に基づいて調整され得る。例えば彩度成分のビット深度は、輝度成分および彩度成分のビット深度のビット深度差に基づいて調整され得る。スケーリングされた成分は、逆色変換の後に、右ビットシフトを通じて、その元のビット深度に再調整および/または再スケーリングされ得る。
図9は、ロッシー符号化において輝度および彩度のビット深度が異なるときに、ビット深度整列を用いて逆ACTを適用する例示の復号プロセスを示す。図9に示されるように逆量子化910および逆変換912は、それぞれ輝度成分Y並びに彩度成分CgおよびCoなどの、残差係数に対して行われ得る。残差係数は、逆CCP950に提供され得る。逆成分間予測が行われた後に、953において輝度成分および彩度成分のビット深度が整列され得る。
輝度および彩度成分のビット深度が異なるかどうかが決定され得る。輝度および彩度成分のビット深度が異なるという条件で、ビット深度整列動作が行われ得る。輝度成分と彩度成分のビット深度のビット深度差が決定され得る。より低いビット深度を有する1または複数の成分に、ビット深度差だけ左ビットシフトが適用され得る。例えば、変数デルタビット深度は深度差を表すことができる。BitDepthYがBitDepthCより大きいとき、デルタビット深度変数は、ΔB=BitDepthY−BitDepthCとして設定され得る。彩度成分に対する係数はデルタビット深度の値だけ左シフトされ得る。BitDepthYがBitDepthCより小さいとき、デルタビット深度変数は、ΔB=BitDepthC−BitDepthYとして設定され得る。輝度成分に対する係数は、デルタビット深度の値だけ左シフトされ得る。
図9に示されるように左ビットシフトは、ΔBだけ彩度成分に適用され得る。残差係数は、逆色変換動作955によって元の色空間に戻るように変換され得る。960において、彩度成分などのスケーリングされた成分は、図9に示されるように右ビットシフトを通じて、それらの元のビット深度に再調整および/または再スケーリングされ得る。
ビット深度整列はビットシフトを含み得る。図9に示されるように、彩度成分に左ビットシフトが適用され得る。他の例では左ビットシフトは輝度成分に適用され得る(例えばBitDepthYがBitDepthCより小さいとき)。彩度成分の逆変換および/または逆CCPなどの復号プロセスは、BitDepthCなどの元の内部ビット深度において動作し得る。
式23は、ビット深度を整列するように、行列乗算によるビットシフト動作を用いた例示の逆色変換を示す。
輝度および彩度成分の間のビット深度差は、彩度成分のQPを調整するために補償され得る。例えば量子化ステップサイズが、QPのインクリメントのたびに21/6倍に増加し、6インクリメントごとに2倍になる場合、6ΔBだけQPを増加させることは、ΔBビットだけ右シフトすることによって信号の大きさをスケーリングすることと等価となり得る。6ΔBのQP調整は、彩度成分に適用され得る。逆色変換への入力信号は、その輝度および彩度成分に対して同じビット深度を有することができる。
例えばロッシー符号化において輝度および彩度のビット深度が異なるとき、輝度および/または彩度成分のQPは、ビット深度差に基づいて調整され得る。図10は、QP調整を用いて逆ACTを適用する例示の復号プロセスを示す。1010において彩度成分のQPは、逆CCP1050への入力信号がその輝度および彩度成分に対して同じビット深度を有し得るように調整され得る。輝度成分のビット深度が彩度成分のビット深度より高いとき、彩度逆変換および逆色変換は、輝度ビット深度において動作され得る。輝度成分のビット深度が彩度成分より低いとき、彩度逆変換および逆色変換は、それらの元のビット深度において動作され得る。図10に示されるように逆変換1012は残差係数に対して行われ得る。残差係数は逆CCP1050に提供され得る。残差係数は、逆色変換動作1055によって、元の色空間に戻るように変換され得る。1060において、彩度成分などのスケーリングされた成分は、図10に示されるように右ビットシフトを通じて、それらの元のビット深度に再調整および/または再スケーリングされ得る。
図11は、ロッシー符号化において輝度および彩度のビット深度が異なるとき、彩度逆変換の後の左ビットシフトを用いて逆ACTを適用する例示の復号プロセスを示す。彩度成分の逆変換は、元の、より低いビット深度を用い得る。QP調整はスキップされ得る。
図11に示されるように、逆量子化1110および逆変換1112は、それぞれ輝度成分Y並びに彩度成分CgおよびCoなど、残差係数に対して行われ得る。逆成分間予測1153が行われる前に、輝度成分および彩度成分のビット深度は、1150において整列され得る。ビット深度が整列された後に、残差係数に対して逆CCP1153が行われ得る。残差係数は、逆色変換動作1155によって元の色空間に戻るように変換され得る。1160において、彩度成分などのスケーリングされた成分は、図11に示されるように右ビットシフトを通じて、それらの元のビット深度に再調整および/または再スケーリングされ得る。
本明細書で述べられる技法は、任意の考えられる組み合わせに組み合わされ得る。それらはまた任意の考えられる組み合わせに組み合わされ得る。例えば組み合わされた逆CCPおよびACT、CCPパラメータの範囲調整、輝度QP調整および彩度成分のQPを調整する技法は、逆CCPおよび逆色変換の両方が同じビット深度で動作するという仮定の下に構築され得る。この組み合わせにおいて逆CCPおよび逆色変換は、輝度および彩度成分のうちのより高いビット深度、例えばmax(BitDepthY,BitDepthC)において行われ得る。
図12は、組み合わされた逆CCPおよび逆ACTにおける例示の復号プロセスを示す。示されるように復号プロセスは、組み合わされた逆CCPおよびACT、CCPパラメータの範囲調整、輝度QP調整および彩度成分のQPの調整を含み得る。置き換えおよび他の組み合わせが企図され得る。例えば図示されないがΔBビットの左ビットシフトが、彩度成分に対する逆変換の出力に適用され得る。
図12に示されるように逆量子化1210は、輝度成分Y並びに彩度成分CgおよびCoなど、残差係数に対してそれぞれ行われ得る。輝度QP調整および彩度成分のQPの調整は、逆量子化1210の一部として行われ得る。ΔQYは、YCgCo空間における輝度成分の量子化に適用されるデルタQPを表し得る。これはCCPパラメータの範囲調整に基づいて表8または表9を用いて導き出され得る。逆変換1212が残差係数に対して行われ得る。組み合わされた逆CCPおよび逆ACT1254が行われ得る。残差係数は、元の色空間に戻るように変換され得る。1260において、彩度成分などのスケーリングされた成分は、図12に示されるように右ビットシフトを通じて、それらの元のビット深度に再調整および/または再スケーリングされ得る。
図13Aは、1または複数の開示される実施形態が実施され得る、例示の通信システム100の図である。通信システム100は、複数の無線ユーザに音声、データ、ビデオ、メッセージング、ブロードキャスト等のコンテンツを提供する多元接続システムとすることができる。通信システム100は、複数の無線ユーザが、無線帯域幅を含むシステムリソースの共有を通じてこのようなコンテンツにアクセスすることを可能にし得る。例えば通信システム100は、符号分割多元接続(CDMA)、時分割多元接続(TDMA)、周波数分割多元接続(FDMA)、直交FDMA(OFDMA)、単一キャリアFDMA(SC−FDMA)等の1または複数のチャネルアクセス方式を使用することができる。
図13Aに示されるように通信システム100は、無線送受信ユニット(WTRU)102a、102b、102cおよび/または102d(これらは全体としてまたはまとめてWTRU102と呼ばれ得る)、無線アクセスネットワーク(RAN)103/104/105、コアネットワーク106/107/109、公衆交換電話ネットワーク(PSTN)108、インターネット110および他のネットワーク112を含むことができるが、開示される実施形態は任意の数のWTRU、基地局、ネットワーク、および/またはネットワーク要素を企図することが理解されるであろう。WTRU102a、102b、102c、102dのそれぞれは、無線環境において動作および/または通信するように構成された任意のタイプのデバイスとすることができる。例としてWTRU102a、102b、102c、102dは、無線信号を送信および/または受信するように構成されることができ、ユーザ機器(UE)、移動局、固定またはモバイル加入者ユニット、ページャ、携帯電話、携帯情報端末(PDA)、スマートフォン、ラップトップ、ノートブック、パーソナルコンピュータ、無線センサ、民生用電子機器などを含むことができる。
通信システム100はまた、基地局114aおよび基地局114bを含むことができる。基地局114a、114bのそれぞれは、コアネットワーク106/107/109、インターネット110および/またはネットワーク112などの、1または複数の通信ネットワークへのアクセスを容易にするように、WTRU102a、102b、102c、102dの少なくとも1つと無線でインターフェース接続するように構成された任意のタイプのデバイスとすることができる。例えば基地局114a、114bは、基地トランシーバ局(BTS)、ノードB、eノードB、ホームノードB、ホームeノードB、サイトコントローラ、アクセスポイント(AP)、無線ルータなどとすることができる。基地局114a、114bはそれぞれ単一の要素として示されるが、基地局114a、114bは、任意の数の相互接続された基地局および/またはネットワーク要素を含み得ることが理解されるであろう。
基地局114aはRAN103/104/105の一部とすることができ、これはまた基地局コントローラ(BSC)、無線ネットワークコントローラ(RNC)、中継ノードなど、他の基地局および/またはネットワーク要素(図示せず)を含むことができる。基地局114aおよび/または基地局114bは、セル(図示せず)と呼ばれ得る特定の地理的領域内で、無線信号を送信および/または受信するように構成され得る。セルはさらにセルセクタに分割され得る。例えば基地局114aに関連付けられたセルは、3つのセクタに分割され得る。従って一実施形態では基地局114aは、3つのトランシーバ、例えばセルの各セクタに対して1つを含むことができる。実施形態では基地局114aは、多入力多出力(MIMO)技術を使用することができ、従ってセルの各セクタに対して複数のトランシーバを利用することができる。
基地局114a、114bは、任意の適切な無線通信リンク(例えば無線周波数(RF)、マイクロ波、赤外線(IR)、紫外線(UV)、可視光など)とすることができるエアインターフェース115/116/117を通して、WTRU102a、102b、102c、102dの1または複数と通信することができる。エアインターフェース115/116/117は、任意の適切な無線アクセス技術(RAT)を用いて確立され得る。
より具体的には上記のように通信システム100は、多元接続システムとすることができ、CDMA、TDMA、FDMA、OFDMA、SC−FDMAなどの1または複数のチャネルアクセス方式を使用することができる。例えばRAN103/104/105内の基地局114a、およびWTRU102a、102b、102cは、ユニバーサル移動体通信システム(UMTS)地上無線アクセス(UTRA)などの無線技術を実施することができ、これは広帯域CDMA(WCDMA(登録商標))を用いてエアインターフェース115/116/117を確立することができる。WCDMAは、高速パケットアクセス(HSPA)および/またはEvolved HSPA(HSPA+)などの通信プロトコルを含むことができる。HSPAは、高速ダウンリンクパケットアクセス(HSDPA)および/または高速アップリンクパケットアクセス(HSUPA)を含むことができる。
実施形態では基地局114aおよびWTRU102a、102b、102cは、Evolved UMTS地上無線アクセス(E−UTRA)などの無線技術を実施することができ、これはロングタームエボリューション(LTE)および/またはLTE−Advanced(LTE−A)を用いて、エアインターフェース115/116/117を確立することができる。
他の実施形態では基地局114aおよびWTRU102a、102b、102cは、IEEE802.16(例えば、WiMAX:Worldwide Interoperability for Microwave Access)、CDMA2000、CDMA2000 1X、CDMA2000 EV−DO、暫定標準2000(IS−2000)、暫定標準95(IS−95)、暫定標準856(IS−856)、移動体通信用グローバルシステム(GSM(登録商標))、GSM進化型高速データレート(EDGE)、GSM EDGE(GERAN)などの無線技術を実施することができる。
図13Aの基地局114bは、例えば無線ルータ、ホームノードB、ホームeノードB、またはアクセスポイントとすることができ、事業所、ホーム、乗り物、キャンパスなどの局所的エリアにおける無線接続性を容易にするための、任意の適切なRATを利用することができる。一実施形態では基地局114bおよびWTRU102c、102dは、無線ローカルエリアネットワーク(WLAN)を確立するために、IEEE802.11などの無線技術を実施することができる。実施形態では基地局114bおよびWTRU102c、102dは、無線パーソナルエリアネットワーク(WPAN)を確立するために、IEEE802.15などの無線技術を実施することができる。他の実施形態では基地局114bおよびWTRU102c、102dは、ピコセルまたはフェムトセルを確立するために、セルラベースのRAT(例えばWCDMA、CDMA2000、GSM、LTE、LTE−Aなど)を利用することができる。図13Aに示されるように基地局114bは、インターネット110への直接接続を有することができる。従って基地局114bは、コアネットワーク106/107/109を経由してインターネット110にアクセスする必要がなくなり得る。
RAN103/104/105はコアネットワーク106/107/109と通信することができ、これは音声、データ、アプリケーション、および/またはVoIP(Voice over Internet Protocol)サービスを、WTRU102a、102b、102c、102dの1または複数に提供するように構成された任意のタイプのネットワークとすることができる。例えばコアネットワーク106/107/109は、呼制御、料金請求サービス、モバイル位置ベースのサービス、プリペイドコール、インターネット接続性、ビデオ配信などをもたらすことができ、および/またはユーザ認証などの高レベルセキュリティ機能を行うことができる。図13Aに示されないが、RAN103/104/105および/またはコアネットワーク106/107/109は、RAN103/104/105と同じRATまたは異なるRATを使用する他のRANと、直接または間接に通信できることが理解されるであろう。例えば、E−UTRA無線技術を利用し得るRAN103/104/105に接続されることに加えて、コアネットワーク106/107/109はまた、GSM無線技術を使用する別のRAN(図示せず)とも通信することができる。
コアネットワーク106/107/109はまた、PSTN108、インターネット110および/または他のネットワーク112にアクセスするように、WTRU102a、102b、102c、102dのためのゲートウェイとして働くことができる。PSTN108は、従来型電話サービス(POTS:plain old telephone service)を提供する回線交換電話網を含むことができる。インターネット110は、TCP/IPインターネットプロトコル群におけるTCP、UDPおよびIPなどの共通通信プロトコルを用いる、相互接続されたコンピュータネットワークおよびデバイスの地球規模のシステムを含むことができる。ネットワーク112は、他のサービスプロバイダによって所有および/または運用される有線もしくは無線通信ネットワークを含むことができる。例えばネットワーク112は、RAN103/104/105と同じRATまたは異なるRATを使用することができる1または複数のRANに接続された、別のコアネットワークを含むことができる。
通信システム100内のWTRU102a、102b、102c、102dのいくつかまたは全ては、マルチモード能力を含むことができ、例えばWTRU102a、102b、102c、102dは、異なる無線リンクを通して異なる無線ネットワークと通信するための複数のトランシーバを含むことができる。例えば図13Aに示されるWTRU102cは、セルラベースの無線技術を使用し得る基地局114aと、およびIEEE802無線技術を使用し得る基地局114bと通信するように構成され得る。
図13Bは、例示のWTRU102のシステム図である。図13Bに示されるようにWTRU102は、プロセッサ118、トランシーバ120、送受信要素122、スピーカ/マイク124、キーパッド126、ディスプレイ/タッチパッド128、非リムーバブルメモリ130、リムーバブルメモリ132、電源134、GPSチップセット136、および他の周辺装置138を含むことができる。WTRU102は、実施形態と一貫性を保ちながら、上記の要素の任意のサブコンビネーションを含み得ることが理解されるであろう。また実施形態は、基地局114aおよび114b、および/または中でも非限定的にトランシーバ局(BTS)、ノードB、サイトコントローラ、アクセスポイント(AP)、ホームノードB、進化型ホームノードB(eノードB)、ホーム進化型ノードB(HeNB)、ホーム進化型ノードBゲートウェイ、およびプロキシノードなど基地局114aおよび114bが表すことができるノードは、図13Bに示され本明細書で述べられる要素のいくつかまたは全てを含み得ることを企図する。
プロセッサ118は、汎用プロセッサ、専用プロセッサ、従来型プロセッサ、デジタル信号プロセッサ(DSP)、複数のマイクロプロセッサ、DSPコアに関連した1または複数のマイクロプロセッサ、コントローラ、マイクロコントローラ、特定用途向け集積回路(ASIC)、フィールドプログラマブルゲートアレイ(FPGA)回路、任意の他のタイプの集積回路(IC)、状態機械などとすることができる。プロセッサ118は、信号符号化、データ処理、電力制御、入力/出力処理、および/またはWTRU102が無線環境において動作することを可能にする任意の他の機能を行うことができる。プロセッサ118はトランシーバ120に結合されることができ、これは送受信要素122に結合され得る。図13Bはプロセッサ118およびトランシーバ120を別個の構成要素として示すが、プロセッサ118およびトランシーバ120は、電子回路パッケージまたはチップ内に一緒に統合され得ることが理解されるであろう。
送受信要素122は、エアインターフェース115/116/117を通して、基地局(例えば基地局114a)に信号を送信し、またはそれから信号を受信するように構成され得る。例えば一実施形態では送受信要素122は、RF信号を送信および/または受信するように構成されたアンテナとすることができる。実施形態では送受信要素122は、例えばIR、UV、または可視光信号を送信および/または受信するように構成されたエミッタ/検出器とすることができる。他の実施形態では送受信要素122は、RFおよび光信号の両方を送信および受信するように構成され得る。送受信要素122は、無線信号の任意の組み合わせを送信および/または受信するように構成され得ることが理解されるであろう。
さらに図13Bでは送受信要素122は単一の要素として示されるが、WTRU102は任意の数の送受信要素122を含むことができる。より具体的にはWTRU102は、MIMO技術を使用することができる。従って一実施形態ではWTRU102は、エアインターフェース115/116/117を通して無線信号を送信および受信するための、2つ以上の送受信要素122(例えば複数のアンテナ)を含むことができる。
トランシーバ120は、送受信要素122によって送信されることになる信号を変調するように、および送受信要素122によって受信された信号を復調するように構成され得る。上記のようにWTRU102は、マルチモード能力を有することができる。従ってトランシーバ120は、WTRU102が例えばUTRAおよびIEEE802.11などの複数のRATによって通信することを可能にするための、複数のトランシーバを含むことができる。
WTRU102のプロセッサ118は、スピーカ/マイク124、キーパッド126、および/またはディスプレイ/タッチパッド128(例えば液晶表示(LCD)ディスプレイユニット、または有機発光ダイオード(OLED)ディスプレイユニット)に結合されることができ、それらからユーザ入力データを受け取ることができる。プロセッサ118はまた、スピーカ/マイク124、キーパッド126、および/またはディスプレイ/タッチパッド128に、ユーザデータを出力することができる。さらにプロセッサ118は、非リムーバブルメモリ130および/またはリムーバブルメモリ132などの任意のタイプの適切なメモリからの情報にアクセスし、それにデータを記憶することができる。非リムーバブルメモリ130は、RAM、ROM、ハードディスク、または任意の他のタイプのメモリ記憶デバイスを含むことができる。リムーバブルメモリ132は、加入者識別モジュール(SIM)カード、メモリスティック、セキュアデジタル(SD)メモリカードなどを含むことができる。他の実施形態ではプロセッサ118は、サーバまたはホームコンピュータ(図示せず)上など、物理的にWTRU102上に位置しないメモリからの情報にアクセスし、それにデータを記憶することができる。
プロセッサ118は、電源134から電力を受け取ることができ、WTRU102内の他の構成要素に対して電力を分配および/または制御するように構成され得る。電源134は、WTRU102に電力供給するための任意の適切なデバイスとすることができる。例えば電源134は、1または複数の乾電池(例えばニッケルカドミウム(NiCd)、ニッケル亜鉛(NiZn)、ニッケル水素(NiMH)、リチウムイオン(Liイオン)など)、太陽電池、燃料電池などを含むことができる。
プロセッサ118はまたGPSチップセット136に結合されることができ、これはWTRU102の現在位置に関する位置情報(例えば経度および緯度)をもたらすように構成され得る。GPSチップセット136からの情報に加えてまたはその代わりにWTRU102は、エアインターフェース115/116/117を通して基地局(例えば基地局114a、114b)から位置情報を受信することができ、および/または2つ以上の近くの基地局から受信される信号のタイミングに基づいてその位置を決定することができる。WTRU102は、実施形態と一貫性を保ちながら、任意の適切な位置決定方法によって位置情報を取得できることが理解されるであろう。
プロセッサ118はさらに他の周辺装置138に結合されることができ、これはさらなる特徴、機能および/または有線もしくは無線接続性を提供する1または複数のソフトウェアおよび/またはハードウェアモジュールを含むことができる。例えば周辺装置138は、加速度計、電子コンパス、衛星トランシーバ、デジタルカメラ(写真またはビデオ用)、ユニバーサルシリアルバス(USB)ポート、振動デバイス、テレビ送受信機、ハンズフリーヘッドセット、ブルートゥース(登録商標)モジュール、周波数変調(FM)ラジオユニット、デジタル音楽プレーヤ、メディアプレーヤ、ビデオゲームプレーヤモジュール、インターネットブラウザなどを含むことができる。
図13Cは、実施形態によるRAN103およびコアネットワーク106のシステム図である。上記のようにRAN103は、UTRA無線技術を使用して、エアインターフェース115を通してWTRU102a、102b、102cと通信することができる。RAN103はまた、コアネットワーク106と通信することができる。図13Cに示されるようにRAN103は、ノードB140a、140b、140cを含むことができ、これらはそれぞれ、エアインターフェース115を通してWTRU102a、102b、102cと通信するための1または複数のトランシーバを含むことができる。ノードB140a、140b、140cはそれぞれ、RAN103内の特定のセル(図示せず)に関連付けられ得る。RAN103はまた、RNC142a、142bを含むことができる。RAN103は、実施形態と一貫性を保ちながら、任意の数のノードBおよびRNCを含み得ることが理解されるであろう。
図13Cに示されるようにノードB140a、140bは、RNC142aと通信することができる。さらにノードB140cは、RNC142bと通信することができる。ノードB140a、140b、140cは、Iubインターフェースを経由して、それぞれRNC142a、142bと通信することができる。RNC142a、142bは、Iurインターフェースを経由して互いに通信することができる。RNC142a、142bのそれぞれは、それが接続されるそれぞれのノードB140a、140b、140cを制御するように構成され得る。さらにRNC142a、142bのそれぞれは、アウターループ電力制御、負荷制御、アドミッション制御、パケットスケジューリング、ハンドオーバ制御、マクロダイバーシティ、セキュリティ機能、データ暗号化などの他の機能を、実行またはサポートするように構成され得る。
図13Cに示されるコアネットワーク106は、メディアゲートウェイ(MGW)144、モバイルスイッチングセンタ(MSC)146、サービングGPRSサポートノード(SGSN)148および/またはゲートウェイGPRSサポートノード(GGSN)150を含むことができる。上記の要素のそれぞれはコアネットワーク106の一部として示されるが、これらの要素のいずれの1つも、コアネットワークオペレータ以外のエンティティによって所有および/または運用され得ることが理解されるであろう。
RAN103内のRNC142aは、IuCSインターフェースを経由してコアネットワーク106内のMSC146に接続され得る。MSC146は、MGW144に接続され得る。MSC146およびMGW144は、WTRU102a、102b、102cと従来型の陸線通信デバイスとの間の通信を容易にするために、PSTN108などの回線交換ネットワークへのアクセスをWTRU102a、102b、102cに提供することができる。
RAN103内のRNC142aはまた、IuPSインターフェースを経由してコアネットワーク106内のSGSN148に接続され得る。SGSN148は、GGSN150に接続され得る。SGSN148およびGGSN150は、WTRU102a、102b、102cとIP対応デバイスとの間の通信を容易にするために、インターネット110などのパケット交換ネットワークへのアクセスをWTRU102a、102b、102cにもたらすことができる。
上記のようにコアネットワーク106はまた、ネットワーク112に接続されることができ、これは他のサービスプロバイダによって所有および/または運用される他の有線もしくは無線ネットワークを含むことができる。
図13Dは、実施形態によるRAN104およびコアネットワーク107のシステム図である。上記のようにRAN104は、E−UTRA無線技術を使用して、エアインターフェース116を通してWTRU102a、102b、102cと通信することができる。RAN104はまた、コアネットワーク107と通信することができる。
RAN104はeノードB160a、160b、160cを含むことができるが、RAN104は、実施形態と一貫性を保ちながら、任意の数のeノードBを含み得ることが理解されるであろう。eノードB160a、160b、160cはそれぞれ、エアインターフェース116を通してWTRU102a、102b、102cと通信するための1または複数のトランシーバを含むことができる。一実施形態ではeノードB160a、160b、160cは、MIMO技術を実施することができる。従って例えばeノードB160aは、複数のアンテナを用いてWTRU102aに無線信号を送信し、それから無線信号を受信することができる。
eノードB160a、160b、160cのそれぞれは、特定のセル(図示せず)に関連付けられることができ、無線リソース管理決定、ハンドオーバ決定、アップリンクおよび/またはダウンリンクにおけるユーザのスケジューリングなどを取り扱うように構成され得る。図13Dに示されるようにeノードB160a、160b、160cは、X2インターフェースを通して互いに通信することができる。
図13Dに示されるコアネットワーク107は、モビリティ管理エンティティ(MME)162、サービングゲートウェイ164およびパケットデータネットワーク(PDN)ゲートウェイ166を含むことができる。上記の要素のそれぞれはコアネットワーク107の一部として示されるが、これらの要素のいずれの1つも、コアネットワークオペレータ以外のエンティティによって所有および/または運用され得ることが理解されるであろう。
MME162は、S1インターフェースを経由してRAN104内のeノードB160a、160b、160cのそれぞれに接続されることができ、制御ノードとして働くことができる。例えばMME162は、WTRU102a、102b、102cの初期アタッチ時に、WTRU102a、102b、102cのユーザを認証すること、ベアラ活動化/非活動化、特定のサービングゲートウェイを選択すること等に対して責任をもち得る。MME162はまた、RAN104と、GSMまたはWCDMAなどの他の無線技術を使用する他のRAN(図示せず)との間で切り換えるための、制御プレーン機能をもたらすことができる。
サービングゲートウェイ164は、S1インターフェースを経由してRAN104内のeノードB160a、160b、160cのそれぞれに接続され得る。サービングゲートウェイ164は一般に、WTRU102a、102b、102cへのまたはそれらからのユーザデータパケットを、経路指定および転送することができる。サービングゲートウェイ164はまた、eノードB間ハンドオーバ時にユーザプレーンをアンカリングすること、WTRU102a、102b、102cのためのダウンリンクデータが使用可能であるときにページングをトリガすること、WTRU102a、102b、102cのコンテキストを管理および記憶することなどの他の機能を行うことができる。
サービングゲートウェイ164はまた、PDNゲートウェイ166に接続されることができ、これはWTRU102a、102b、102cとIP対応デバイスとの間の通信を容易にするために、インターネット110などのパケット交換ネットワークへのアクセスをWTRU102a、102b、102cにもたらすことができる。
コアネットワーク107は、他のネットワークとの通信を容易にすることができる。例えばコアネットワーク107は、WTRU102a、102b、102cと従来型の陸線通信デバイスとの間の通信を容易にするために、PSTN108などの回線交換ネットワークへのアクセスをWTRU102a、102b、102cに提供することができる。例えばコアネットワーク107は、コアネットワーク107とPSTN108との間のインターフェースとして働くIPゲートウェイ(例えばIPマルチメディアサブシステム(IMS)サーバ)を含むことができ、またはそれと通信することができる。さらにコアネットワーク107は、WTRU102a、102b、102cにネットワーク112へのアクセスをもたらすことができ、これは他のサービスプロバイダによって所有および/または運用される他の有線もしくは無線ネットワークを含むことができる。
図13Eは、実施形態によるRAN105およびコアネットワーク109のシステム図である。RAN105は、IEEE802.16無線技術を使用して、エアインターフェース117を通してWTRU102a、102b、102cと通信するアクセスサービスネットワーク(ASN)とすることができる。以下でさらに論じられるように、WTRU102a、102b、102c、RAN105、およびコアネットワーク109の異なる機能エンティティ間の通信リンクは、基準点として定義され得る。
図13Eに示されるようにRAN105は、基地局180a、180b、180c、およびASNゲートウェイ182を含むことができるが、RAN105は実施形態と一貫性を保ちながら、任意の数の基地局およびASNゲートウェイを含み得ることが理解されるであろう。基地局180a、180b、180cはそれぞれRAN105内の特定のセル(図示せず)に関連付けられることができ、それぞれエアインターフェース117を通してWTRU102a、102b、102cと通信するための1または複数のトランシーバを含むことができる。一実施形態では基地局180a、180b、180cは、MIMO技術を実施することができる。従って例えば基地局180aは、複数のアンテナを用いてWTRU102aに無線信号を送信し、それから無線信号を受信することができる。基地局180a、180b、180cはまた、ハンドオフトリガリング、トンネル確立、無線リソース管理、トラフィック分類、サービス品質(QoS)ポリシー実施などの、モビリティ管理機能を提供することができる。ASNゲートウェイ182は、トラフィック集約ポイントとして働くことができ、ページング、加入者プロファイルのキャッシング、コアネットワーク109への経路指定などに対して責任をもち得る。
WTRU102a、102b、102cとRAN105との間のエアインターフェース117は、IEEE802.16仕様を実施するR1基準点として定義され得る。さらにWTRU102a、102b、102cのそれぞれは、コアネットワーク109との論理インターフェース(図示せず)を確立することができる。WTRU102a、102b、102cとコアネットワーク109との間の論理インターフェースは、R2基準点として定義されることができ、これは認証、承認、IPホスト構成管理および/またはモビリティ管理のために用いられ得る。
基地局180a、180b、180cのそれぞれの間の通信リンクは、基地局間のWTRUハンドオーバおよびデータの転送を容易にするためのプロトコルを含むR8基準点として定義され得る。基地局180a、180b、180cとASNゲートウェイ182との間の通信リンクは、R6基準点として定義され得る。R6基準点は、WTRU102a、102b、102cのそれぞれに関連付けられたモビリティイベントに基づくモビリティ管理を容易にするためのプロトコルを含むことができる。
図13Eに示されるようにRAN105は、コアネットワーク109に接続され得る。RAN105とコアネットワーク109との間の通信リンクは、例えばデータ転送およびモビリティ管理能力を容易にするためのプロトコルを含むR3基準点として定義され得る。コアネットワーク109は、モバイルIPホームエージェント(MIP−HA)184、認証、承認、アカウンティング(AAA)サーバ186、およびゲートウェイ188を含むことができる。上記の要素のそれぞれはコアネットワーク109の一部として示されるが、これらの要素のいずれの1つも、コアネットワークオペレータ以外のエンティティによって所有および/または運用され得ることが理解されるであろう。
MIP−HAは、IPアドレス管理に対して責任を持つことができ、WTRU102a、102b、102cが、異なるASNおよび/または異なるコアネットワークの間でローミングすることを可能にし得る。MIP−HA184は、WTRU102a、102b、102cとIP対応デバイスとの間の通信を容易にするために、インターネット110などのパケット交換ネットワークへのアクセスをWTRU102a、102b、102cに提供することができる。AAAサーバ186は、ユーザ認証に対して、およびユーザサービスをサポートすることに対して責任をもち得る。ゲートウェイ188は、他のネットワークとの相互動作を容易にする。例えばゲートウェイ188は、WTRU102a、102b、102cと従来型の陸線通信デバイスとの間の通信を容易にするために、PSTN108などの回線交換ネットワークへのアクセスをWTRU102a、102b、102cに提供することができる。さらにゲートウェイ188はWTRU102a、102b、102cにネットワーク112へのアクセスを提供することができ、これは他のサービスプロバイダによって所有および/または運用される他の有線もしくは無線ネットワークを含むことができる。
図13Eに示されないが、RAN105は他のASNに接続されることができ、コアネットワーク109は他のコアネットワークに接続され得ることが理解されるであろう。RAN105と他のASNとの間の通信リンクは、R4基準点として定義されることができ、これはRAN105と他のASNとの間のWTRU102a、102b、102cのモビリティを調整するためのプロトコルを含むことができる。コアネットワーク109と他のコアネットワークとの間の通信リンクは、R5基準点として定義されることができ、これはホームコアネットワークと訪問先のコアネットワークとの間の相互動作を容易にするためのプロトコルを含むことができる。
特徴および要素は上記では特定の組み合わせにおいて述べられたが、当業者は、各特徴または要素は単独で、または他の特徴および要素との任意の組み合わせにおいて用いられ得ることを理解するであろう。さらに本明細書で述べられた方法は、コンピュータまたはプロセッサによる実行のためにコンピュータ可読媒体に組み込まれた、コンピュータプログラム、ソフトウェア、またはファームウェアにおいて実施され得る。コンピュータ可読媒体の例は、電子信号(有線または無線接続を通して送信される)、およびコンピュータ可読記憶媒体を含む。コンピュータ可読記憶媒体の例は、ROM、RAM、レジスタ、キャッシュメモリ、半導体メモリデバイス、内蔵ハードディスクおよびリムーバブルディスクなどの磁気媒体、光磁気媒体、並びにCD−ROMディスクおよびデジタル多用途ディスク(DVD)などの光媒体を含むが、それらに限定されない。WTRU、UE、端末装置、基地局、RNC、または任意のホストコンピュータにおける使用のための無線周波数トランシーバを実施するように、ソフトウェアに関連してプロセッサが用いられ得る。

Claims (10)

  1. 元の輝度成分のビット深度を有する輝度成分、元の彩度成分のビット深度を有する第1の彩度成分および第2の彩度成分を備えるビデオビットストリームを受信し、
    前記輝度成分、前記第1の彩度成分、および前記第2の彩度成分が整列されたビット深度を有するように、前記輝度成分、前記第1の彩度成分、および前記第2の彩度成分にビット深度整列を実行し、
    前記整列されたビット深度を有する前記輝度成分、前記第1の彩度成分、および前記第2の彩度成分に基づいて、逆色変換を実行し、
    前記逆色変換の後、色成分を前記元の彩度成分のビット深度または前記元の輝度成分のビット深度に戻す
    ように構成されるプロセッサを備えた、ビデオ復号デバイス。
  2. 前記整列されたビット深度は、前記元の輝度成分のビット深度および前記元の彩度成分のビット深度の間でより高いビット深度であり、前記プロセッサは、より低い元のビット深度を有する成分をスケーリングして、前記整列されたビット深度に一致させるようにさらに構成される、請求項1のビデオ復号デバイス。
  3. 前記プロセッサは、
    前記元の輝度成分のビット深度および前記元の彩度成分のビット深度の間のビット深度差異を決定し、
    より低い元のビット深度を有する成分の係数を前記ビット深度差異だけ左シフトする
    ようにさらに構成される、請求項1のビデオ復号デバイス。
  4. 前記プロセッサは、
    前記逆色変換の後、前記色成分の前記係数を前記ビット深度差異だけ右シフトするようにさらに構成される、請求項のビデオ復号デバイス。
  5. 前記輝度成分、前記第1の彩度成分、および前記第2の彩度成分は、残差変換ブロックに関連付けられる、請求項1のビデオ復号デバイス。
  6. 元の輝度成分のビット深度を有する輝度成分、元の彩度成分のビット深度を有する第1の彩度成分および第2の彩度成分を備えるビデオビットストリームを受信することと、
    前記輝度成分、前記第1の彩度成分、および前記第2の彩度成分が整列されたビット深度を有するように、前記輝度成分、前記第1の彩度成分、および前記第2の彩度成分にビット深度整列を実行することと、
    前記整列されたビット深度を有する前記輝度成分、前記第1の彩度成分、および前記第2の彩度成分に基づいて、逆色変換を実行することと
    前記逆色変換の後、色成分を前記元の彩度成分のビット深度または前記元の輝度成分のビット深度に戻すことと
    を含む、ビデオ復号方法。
  7. 前記整列されたビット深度は、前記元の輝度成分のビット深度および前記元の彩度成分のビット深度の間でより高いビット深度であり、前記方法は、より低い元のビット深度を有する成分をスケーリングして、前記整列されたビット深度に一致させることをさらに含む、請求項のビデオ復号方法。
  8. 前記元の輝度成分のビット深度および前記元の彩度成分のビット深度の間のビット深度差異を決定することと、
    より低い元のビット深度を有する成分の係数を前記ビット深度差異だけ左シフトすることと
    をさらに含む、請求項のビデオ復号方法。
  9. 前記成分の前記係数は、前記ビット深度差異だけ右シフトされる、請求項のビデオ復号方法。
  10. 前記輝度成分、前記第1の彩度成分、および前記第2の彩度成分は、残差変換ブロックに関連付けられる、請求項のビデオ復号方法。
JP2018101439A 2014-09-12 2018-05-28 ビデオ符号化のための成分間相関解除 Active JP6709823B2 (ja)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US201462049843P 2014-09-12 2014-09-12
US62/049,843 2014-09-12
US201562171542P 2015-06-05 2015-06-05
US62/171,542 2015-06-05

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2017514297A Division JP2017531382A (ja) 2014-09-12 2015-09-11 ビデオ符号化のための成分間相関解除

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2020090660A Division JP2020129845A (ja) 2014-09-12 2020-05-25 ビデオ符号化のための成分間相関解除

Publications (3)

Publication Number Publication Date
JP2018160911A JP2018160911A (ja) 2018-10-11
JP2018160911A5 JP2018160911A5 (ja) 2018-11-22
JP6709823B2 true JP6709823B2 (ja) 2020-06-17

Family

ID=54238556

Family Applications (3)

Application Number Title Priority Date Filing Date
JP2017514297A Pending JP2017531382A (ja) 2014-09-12 2015-09-11 ビデオ符号化のための成分間相関解除
JP2018101439A Active JP6709823B2 (ja) 2014-09-12 2018-05-28 ビデオ符号化のための成分間相関解除
JP2020090660A Withdrawn JP2020129845A (ja) 2014-09-12 2020-05-25 ビデオ符号化のための成分間相関解除

Family Applications Before (1)

Application Number Title Priority Date Filing Date
JP2017514297A Pending JP2017531382A (ja) 2014-09-12 2015-09-11 ビデオ符号化のための成分間相関解除

Family Applications After (1)

Application Number Title Priority Date Filing Date
JP2020090660A Withdrawn JP2020129845A (ja) 2014-09-12 2020-05-25 ビデオ符号化のための成分間相関解除

Country Status (9)

Country Link
US (1) US10469847B2 (ja)
EP (2) EP3544298A1 (ja)
JP (3) JP2017531382A (ja)
KR (1) KR102051193B1 (ja)
CN (1) CN107079157B (ja)
BR (1) BR112017004886A2 (ja)
RU (1) RU2017112309A (ja)
TW (1) TWI722996B (ja)
WO (1) WO2016040865A1 (ja)

Families Citing this family (77)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3055997B1 (en) * 2013-10-07 2019-12-04 VID SCALE, Inc. Combined scalability processing for multi-layer video coding
US11070810B2 (en) * 2014-03-14 2021-07-20 Qualcomm Incorporated Modifying bit depths in color-space transform coding
WO2016049327A1 (en) * 2014-09-26 2016-03-31 Dolby Laboratories Licensing Corporation Encoding and decoding perceptually-quantized video content
US9838662B2 (en) * 2014-10-10 2017-12-05 Qualcomm Incorporated Harmonization of cross-component prediction and adaptive color transform in video coding
US10390020B2 (en) * 2015-06-08 2019-08-20 Industrial Technology Research Institute Video encoding methods and systems using adaptive color transform
US20160360205A1 (en) * 2015-06-08 2016-12-08 Industrial Technology Research Institute Video encoding methods and systems using adaptive color transform
JP2018056685A (ja) * 2016-09-27 2018-04-05 株式会社ドワンゴ 画像符号化装置、画像符号化方法、及び画像符号化プログラム、並びに、画像復号装置、画像復号方法、及び画像復号プログラム
AU2018230328B2 (en) * 2017-03-10 2021-05-06 Hfi Innovation Inc. Method and apparatus of implicit intra coding tool settings with intra directional prediction modes for video coding
DE102017204946A1 (de) * 2017-03-23 2018-09-27 Volkswagen Aktiengesellschaft Verfahren zur Bestimmung eines Wertes einer Integer-Skalierung in einer Verknüpfung von Eingangsmengen zu Ausgangsmengen und Computerprogrammprodukt
US10778978B2 (en) * 2017-08-21 2020-09-15 Qualcomm Incorporated System and method of cross-component dynamic range adjustment (CC-DRA) in video coding
CA3075641A1 (en) 2017-09-15 2019-03-21 Sony Corporation Image processing device and method
US10681358B2 (en) * 2017-12-19 2020-06-09 Qualcomm Incorporated Quantization parameter control for video coding with joined pixel/transform based quantization
WO2019148977A1 (en) * 2018-02-01 2019-08-08 Mediatek Inc. Methods and apparatuses of video encoding or decoding with adaptive quantization of video data
GB2571313B (en) * 2018-02-23 2022-09-21 Canon Kk New sample sets and new down-sampling schemes for linear component sample prediction
WO2019190199A1 (ko) * 2018-03-27 2019-10-03 주식회사 케이티 비디오 신호 처리 방법 및 장치
WO2019229683A1 (en) 2018-05-31 2019-12-05 Beijing Bytedance Network Technology Co., Ltd. Concept of interweaved prediction
GB2589769B (en) 2018-07-15 2023-02-15 Beijing Bytedance Network Tech Co Ltd Cross-component coding order derivation
TWI814890B (zh) 2018-08-17 2023-09-11 大陸商北京字節跳動網絡技術有限公司 簡化的跨分量預測
BR112021003829A2 (pt) * 2018-09-02 2021-05-18 Lg Electronics Inc. método e aparelho para processamento de sinal de imagem
CN117478883A (zh) 2018-09-12 2024-01-30 北京字节跳动网络技术有限公司 交叉分量线性模型中的尺寸相关的下采样
WO2020058893A1 (en) 2018-09-19 2020-03-26 Beijing Bytedance Network Technology Co., Ltd. History based motion vector predictor for intra block copy
JP2022509962A (ja) * 2018-11-21 2022-01-25 インターデイジタル ヴィーシー ホールディングス インコーポレイテッド ピクチャエンコードおよびデコードのための方法およびデバイス
KR102660160B1 (ko) * 2018-11-22 2024-04-24 베이징 바이트댄스 네트워크 테크놀로지 컴퍼니, 리미티드 서브 블록 기반 인터 예측을 위한 조정 방법
WO2020125796A1 (en) 2018-12-22 2020-06-25 Beijing Bytedance Network Technology Co., Ltd. Two step cross-component prediction mode based on multiple parameter
CN113597760A (zh) 2019-01-02 2021-11-02 北京字节跳动网络技术有限公司 视频处理的方法
CN113366839B (zh) 2019-01-31 2024-01-12 北京字节跳动网络技术有限公司 视频编解码中的细化量化步骤
WO2020176459A1 (en) * 2019-02-28 2020-09-03 Interdigital Vc Holdings, Inc. Method and device for picture encoding and decoding
US11516512B2 (en) * 2019-03-04 2022-11-29 Alibaba Group Holding Limited Method and system for processing video content
KR20210135502A (ko) 2019-03-08 2021-11-15 베이징 바이트댄스 네트워크 테크놀로지 컴퍼니, 리미티드 비디오 처리에서 변형 정보의 시그널링
EP3939296A1 (en) * 2019-03-12 2022-01-19 FRAUNHOFER-GESELLSCHAFT zur Förderung der angewandten Forschung e.V. Selective inter-component transform (ict) for image and video coding
WO2020187161A1 (en) * 2019-03-15 2020-09-24 Mediatek Inc. Method and apparatus of latency reduction for chroma residue scaling
KR20210139328A (ko) * 2019-03-25 2021-11-22 광동 오포 모바일 텔레커뮤니케이션즈 코포레이션 리미티드 화상 예측 방법, 인코더, 디코더 및 저장 매체
CN113692741B (zh) 2019-04-18 2022-12-13 北京字节跳动网络技术有限公司 跨分量模式中的参数推导
CN113711591B (zh) 2019-04-20 2023-10-27 北京字节跳动网络技术有限公司 用于色度残差的联合编解码的语法元素的信令
BR112021019675A2 (pt) 2019-04-23 2021-12-07 Beijing Bytedance Network Tech Co Ltd Método para processamento de mídia visual, aparelho codificador de vídeo, aparelho decodificador de vídeo, e, mídia legível por computador
KR102641796B1 (ko) 2019-05-08 2024-03-04 베이징 바이트댄스 네트워크 테크놀로지 컴퍼니, 리미티드 교차-성분 코딩의 적용가능성에 대한 조건들
BR112021022174A2 (pt) 2019-05-11 2021-12-21 Beijing Bytedance Network Tech Co Ltd Método para processar dados de vídeo, aparelho para processar dados de vídeo, meio de armazenamento e meio de gravação
CN113785574B (zh) 2019-05-30 2022-10-11 北京字节跳动网络技术有限公司 色度分量的自适应环路滤波
CN114097228B (zh) 2019-06-04 2023-12-15 北京字节跳动网络技术有限公司 具有几何分割模式编解码的运动候选列表
EP3963890A4 (en) 2019-06-04 2022-11-02 Beijing Bytedance Network Technology Co., Ltd. BUILDING A LIST OF MOVEMENT CANDIDATES USING NEIGHBOR BLOCK INFORMATION
EP3967032A4 (en) 2019-06-07 2022-07-27 Beijing Bytedance Network Technology Co., Ltd. CONDITIONAL SIGNALING OF A REDUCED SECONDARY TRANSFORM FOR VIDEO BIANARY FLOWS
WO2020257787A1 (en) 2019-06-21 2020-12-24 Beijing Dajia Internet Information Technology Co., Ltd. Methods and devices for prediction dependent residual scaling for video coding
CN117579830A (zh) 2019-06-21 2024-02-20 北京字节跳动网络技术有限公司 自适应环内颜色空间转换和其他编解码工具的选择性使用
CN113994697A (zh) 2019-06-22 2022-01-28 北京字节跳动网络技术有限公司 色度残差缩放的语法元素
JP7460748B2 (ja) 2019-07-07 2024-04-02 北京字節跳動網絡技術有限公司 クロマ残差スケーリングのシグナリング
EP3984215A4 (en) 2019-07-14 2022-08-24 Beijing Bytedance Network Technology Co., Ltd. TRANSFORM BLOCK SIZE RESTRICTION IN VIDEO CODING
CN117560490A (zh) 2019-07-27 2024-02-13 北京字节跳动网络技术有限公司 根据参考图片类型使用工具的限制
JP7422858B2 (ja) 2019-08-03 2024-01-26 北京字節跳動網絡技術有限公司 ビデオ処理方法、装置、記憶媒体及び記憶方法
CN114270838B (zh) 2019-08-20 2024-04-12 北京字节跳动网络技术有限公司 变换跳过模式的信令通知
KR20220058889A (ko) 2019-09-14 2022-05-10 바이트댄스 아이엔씨 비디오 코딩의 크로마 양자화 파라미터
WO2021052492A1 (en) * 2019-09-20 2021-03-25 Beijing Bytedance Network Technology Co., Ltd. Luma mapping with chroma scaling
WO2021052495A1 (en) * 2019-09-20 2021-03-25 Beijing Bytedance Network Technology Co., Ltd. Adaptive resolution change and scalable coding for screen contents
KR20220140871A (ko) * 2019-09-23 2022-10-18 베이징 다지아 인터넷 인포메이션 테크놀로지 컴퍼니 리미티드 4:4:4 크로마 포맷의 비디오 코딩 방법 및 장치
WO2021057996A1 (en) 2019-09-28 2021-04-01 Beijing Bytedance Network Technology Co., Ltd. Geometric partitioning mode in video coding
WO2021068954A1 (en) 2019-10-12 2021-04-15 Beijing Bytedance Network Technology Co., Ltd. High level syntax for video coding tools
CN114556924B (zh) * 2019-10-14 2024-01-26 字节跳动有限公司 视频处理中色度残差的联合编解码与滤波的方法、装置及介质
JP7389252B2 (ja) 2019-10-29 2023-11-29 北京字節跳動網絡技術有限公司 クロスコンポーネント適応ループフィルタ
CN115152219A (zh) 2019-11-07 2022-10-04 抖音视界有限公司 视频编解码的自适应环内颜色空间变换的量化特性
JP2023504408A (ja) * 2019-12-05 2023-02-03 アリババ グループ ホウルディング リミテッド クロマサンプリングのための方法及び装置
EP4070554A4 (en) * 2019-12-10 2023-01-25 Beijing Dajia Internet Information Technology Co., Ltd. VIDEO ENCODING METHODS AND APPARATUS IN A 4:4:4 CHROMINANCE FORMAT
CN115104302A (zh) 2019-12-11 2022-09-23 抖音视界有限公司 跨分量适应性回路滤波的样点填充
WO2021121418A1 (en) * 2019-12-19 2021-06-24 Beijing Bytedance Network Technology Co., Ltd. Joint use of adaptive colour transform and differential coding of video
WO2021128281A1 (zh) * 2019-12-27 2021-07-01 富士通株式会社 自适应颜色变换的编解码方法、装置以及视频编解码设备
EP4085637A4 (en) * 2020-01-05 2023-06-07 Beijing Dajia Internet Information Technology Co., Ltd. METHOD AND APPARATUS FOR VIDEO ENCODING IN A 4:4:4 CHROMA FORMAT
JP7436680B2 (ja) 2020-01-05 2024-02-22 北京字節跳動網絡技術有限公司 映像コーディングのための一般制約情報
CN115176470A (zh) 2020-01-18 2022-10-11 抖音视界有限公司 图像/视频编解码中的自适应颜色变换
US20240048733A1 (en) * 2020-01-25 2024-02-08 Lg Electronics Inc. Image or video coding for residuals using color space transformation
US20230103632A1 (en) * 2020-01-25 2023-04-06 Lg Electronics Inc. Act residual-based image or video coding
US20230139083A1 (en) * 2020-01-25 2023-05-04 Lg Electronics Inc. Image or video coding based on color space conversion
CN113395524B (zh) * 2020-03-11 2023-04-28 腾讯美国有限责任公司 视频解码方法、装置和电子设备
US11146806B2 (en) * 2020-03-11 2021-10-12 Tencent America LLC Coding unit level transform size restriction for adaptive color transform
US11445206B2 (en) * 2020-04-16 2022-09-13 Tencent America LLC Method and apparatus for video coding
KR20240059003A (ko) * 2020-06-12 2024-05-07 베이징 다지아 인터넷 인포메이션 테크놀로지 컴퍼니 리미티드 4:4:4 색 포맷의 비디오 코딩 방법 및 장치
JP2023531223A (ja) 2020-06-30 2023-07-21 北京字節跳動網絡技術有限公司 適応ループフィルタリングのための境界位置
EP3972272A1 (en) 2020-09-17 2022-03-23 Lemon Inc. Chroma format and bit depth indication in coded video
US11651551B2 (en) * 2020-10-06 2023-05-16 Qualcomm Incorporated Coding of component of color attributes in geometry-based point cloud compression (G-PCC)
US11645812B2 (en) * 2020-10-06 2023-05-09 Qualcomm Incorporated Inter-component residual prediction for color attributes in geometry point cloud compression coding

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8762441B2 (en) * 2009-06-05 2014-06-24 Qualcomm Incorporated 4X4 transform for media coding
US8885701B2 (en) * 2010-09-08 2014-11-11 Samsung Electronics Co., Ltd. Low complexity transform coding using adaptive DCT/DST for intra-prediction
US9824066B2 (en) * 2011-01-10 2017-11-21 Qualcomm Incorporated 32-point transform for media data coding
US9495162B2 (en) * 2011-12-23 2016-11-15 Intel Corporation Apparatus and method for performing a permute operation
JP2014116733A (ja) * 2012-12-07 2014-06-26 Canon Inc 画像符号化装置、画像符号化方法及びプログラム、画像復号装置、画像復号方法及びプログラム
US9648330B2 (en) * 2013-07-15 2017-05-09 Qualcomm Incorporated Inter-color component residual prediction
EP3055997B1 (en) * 2013-10-07 2019-12-04 VID SCALE, Inc. Combined scalability processing for multi-layer video coding
CN103796033B (zh) * 2014-01-24 2017-05-24 同济大学 一种高效视频编码零系数提前检测方法
US11070810B2 (en) * 2014-03-14 2021-07-20 Qualcomm Incorporated Modifying bit depths in color-space transform coding
US10200700B2 (en) * 2014-06-20 2019-02-05 Qualcomm Incorporated Cross-component prediction in video coding

Also Published As

Publication number Publication date
JP2018160911A (ja) 2018-10-11
TW201613352A (en) 2016-04-01
RU2017112309A3 (ja) 2018-10-12
KR20170056626A (ko) 2017-05-23
EP3192261A1 (en) 2017-07-19
KR102051193B1 (ko) 2019-12-02
JP2017531382A (ja) 2017-10-19
US20160080751A1 (en) 2016-03-17
WO2016040865A1 (en) 2016-03-17
CN107079157B (zh) 2020-12-22
RU2017112309A (ru) 2018-10-12
CN107079157A (zh) 2017-08-18
BR112017004886A2 (pt) 2017-12-05
US10469847B2 (en) 2019-11-05
TWI722996B (zh) 2021-04-01
JP2020129845A (ja) 2020-08-27
EP3544298A1 (en) 2019-09-25

Similar Documents

Publication Publication Date Title
JP6709823B2 (ja) ビデオ符号化のための成分間相関解除
JP6684867B2 (ja) Rgbビデオコーディングエンハンスメントのためのシステムおよび方法
JP7433019B2 (ja) ビデオコーディングにおけるクロマ信号強調のためのクロスプレーンフィルタリング
CN107211134B (zh) 用于调色编码模式的逃逸色彩编码
CN109982081B (zh) 用于多层视频编码的自适应上采样
JP6242793B2 (ja) 空間的予測のためのシステムおよび方法
JP6397902B2 (ja) スケーラブルビデオ符号化のためのレイヤ間予測

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20180911

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20180911

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20190806

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20190827

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20191121

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20200324

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20200423

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20200525

R150 Certificate of patent or registration of utility model

Ref document number: 6709823

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250