JP7434554B2 - カスケード予測 - Google Patents

カスケード予測 Download PDF

Info

Publication number
JP7434554B2
JP7434554B2 JP2022533503A JP2022533503A JP7434554B2 JP 7434554 B2 JP7434554 B2 JP 7434554B2 JP 2022533503 A JP2022533503 A JP 2022533503A JP 2022533503 A JP2022533503 A JP 2022533503A JP 7434554 B2 JP7434554 B2 JP 7434554B2
Authority
JP
Japan
Prior art keywords
predictor
image
domain
prediction
cascade
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2022533503A
Other languages
English (en)
Other versions
JP2023504837A (ja
Inventor
カドゥ,ハルシャド
スゥ,グワン-ミーン
Original Assignee
ドルビー ラボラトリーズ ライセンシング コーポレイション
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ドルビー ラボラトリーズ ライセンシング コーポレイション filed Critical ドルビー ラボラトリーズ ライセンシング コーポレイション
Publication of JP2023504837A publication Critical patent/JP2023504837A/ja
Application granted granted Critical
Publication of JP7434554B2 publication Critical patent/JP7434554B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/109Selection of coding mode or of prediction mode among a plurality of temporal predictive coding modes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/184Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being bits, e.g. of the compressed video stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/186Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a colour or a chrominance component
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/1887Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a variable length codeword
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • H04N19/467Embedding additional information in the video signal during the compression process characterised by the embedded information being invisible, e.g. watermarking

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Description

関連出願への相互基準
本出願は、2019年12月6日に出願された欧州特許出願第19214124.0号および2019年12月6日に出願された米国仮特許出願第62/944,636号に対する優先権を主張し、これらは参照により本明細書に組み込まれる。
本開示は、一般に、画像処理操作に関する。より詳細には、本開示の一実施形態は、ビデオコーデックに関する。
本明細書で使用する場合、用語「ダイナミックレンジ」(DR)は、例えば、最も暗い黒(ダーク)から最も明るい白(ハイライト)までの、画像での強度(例えば、輝度、ルマ)の範囲を知覚する人間の視覚システム(HVS)の能力に関連してもよい。この意味で、DRは「シーン基準」強度に関する。また、DRは、特定の幅の強度範囲を十分にまたは近似的に描画する表示デバイスの能力にも関連し得る。この意味で、DRは「ディスプレイ基準」強度に関する。本明細書の記載のいずれかの時点において、特定の意味が特定の意義を有するように明示的に規定されていない限り、この用語は、いずれの意味においても、例えば、互換的に使用され得ると推測されるべきである。
本明細書で使用する場合、用語「高ダイナミックレンジ(HDR)」は、人間の視覚システム(HVS)のおよそ14~15桁以上の大きさに及ぶDR幅に関連する。実際には、人間が同時に強度範囲中の広い範囲を知覚できるDRは、HDRとの関係でいくぶん切り捨てられる可能性がある。本明細書で使用する場合、強化ダイナミックレンジ(EDR)または視覚ダイナミックレンジ(VDR)という用語は、シーンまたは画像を横切る光順応変化を許容して、目の動きを含む人間の視覚システム(HVS)によってシーンまたは画像内で知覚可能なDRに個別にまたは交換可能に関連することができる。本明細書中で使用される場合、EDRは、5~6桁の大きさのDRに関することができる。したがって、EDRは、真のシーン基準HDRとの関連ではおそらく多少狭いが、EDRは、それにもかかわらず、広いDR幅を表し、HDRと呼んでもよい。
実際には、画像は、色空間の1つ以上の色成分(例えば、輝度Yおよび色度CbおよびCr)を含み、各色成分は、画素当たりnビットの精度(例えば、n=8)によって表される。非線形輝度コーディング(例えば、ガンマエンコーディング)を用いて、n≦8の画像(例えば、カラー24ビットJPEG画像)を標準ダイナミックレンジの画像とみなし、n>8の画像を強化ダイナミックレンジの画像とみなすことができる。
所与のディスプレイに対する基準電気光学伝達関数(EOTF)は、入力ビデオ信号のカラー値(例えば、輝度)とディスプレイによって生成されたスクリーンのカラー値(例えば、スクリーン輝度)との間の関係を特徴付ける。例えば、ITU Rec. ITU-R BT. 1886 「Reference electro-optical transfer function for flat panel displays used in HDTV studio production」(2011年3月)は、その全体が参照により本明細書に組み込まれているが、それはフラットパネルディスプレイのための基準EOTFを定義する。ビデオストリームが与えられた場合、そのEOTFに関する情報は(画像)メタデータとしてビットストリームに埋め込まれる可能性がある。本明細書での用語「メタデータ」は、コーディングされたビットストリームの一部として送信される任意の補助情報に関し、デコーダがデコードされた画像を描画するのを支援する。そのようなメタデータは、本明細書に記載されるように、色空間または色域情報、基準表示パラメータ、および補助信号パラメータを含み得るが、これらに限定されない。
本明細書で使用される用語「PQ」は、知覚的輝度振幅量子化を指す。人間の視覚系は、光レベルの増加に非常に非線形的に応答する。刺激を見る人間の能力は、その刺激の輝度、刺激の大きさ、刺激を構成する空間周波数、および刺激を見るときに眼が適応した輝度レベルによって影響される。いくつかの実施形態では、知覚量子化関数は、線形入力グレーレベルを、人間の視覚システムにおけるコントラスト感度しきい値により良くマッチングする出力グレーレベルにマッピングする。例示的なPQマッピング関数は、SMPTE ST 2084:2014「High Dynamic Range EOTF of Mastering Reference Displays」(以下、「SMPTE」)に記載されており、その全体が参照により本明細書に組み込まれ、ここで、一定の刺激サイズが与えられると、各輝度レベル(例えば、刺激レベルなど)について、その輝度レベルでの最小可視コントラストステップは、最も感度の高い順応レベルおよび最も感度の高い空間周波数に従って(HVSモデルに従って)選択される。
200~1,000cd/mまたはニトの輝度をサポートするディスプレイは、より低いダイナミックレンジ(LDR)を典型的に示し、EDR(またはHDR)に関連して、標準ダイナミックレンジ(SDR)とも呼ばれる。EDRの内容は、より高いダイナミックレンジ(例えば、1,000から5,000ニト以上)をサポートするEDRディスプレイに表示することができる。そのようなディスプレイは、高輝度能力(例えば、0~10,000ニト以上)をサポートする代替EOTFを使用して定義され得る。そのようなEOTFの例は、SMPTE 2084およびRec. ITU-R BT.2100「Image parameter values for high dynamic range television for use in production and international programme exchange」(2017年6月)において定義される。ここでの発明者らによって高評価されるように、広範なSDRおよびHDR表示デバイスの表示能力をサポートするために使用することができるビデオコンテンツデータを構成するための改良された技術が望まれている。
本セクションに記載されているアプローチは、追求でき得たアプローチであるが、必ずしも以前に考案または追求されたアプローチではない。したがって、別段の記載がない限り、本セクションに記載されているいずれのアプローチも、単に本セクションに含まれているという理由のみで先行技術であると仮定するべきではない。同様に、特に断らない限り、1つ以上のアプローチに関して特定された問題点は、本セクションに基づいていかなる先行技術においても認識されていたと仮定すべきではない。
本発明の一実施形態が、添付の図面において、限定としてではなく例示として説明される。図面においては、同様の基準番号は同様の要素を指す。
ビデオ配信パイプラインの例示的なプロセスを示す。 カスケード予測操作を実施する例示的なコーデックを示している。 カスケード予測操作を実施する例示的なコーデックを示している。 カスケード予測操作を実施する例示的なコーデックを示している。 カスケード予測操作を実施する例示的なコーデックを示している。 カスケード予測操作を実施する例示的なコーデックを示している。
入力符号語および予測符号語の分布および相関の例を示す。 入力符号語および予測符号語の分布および相関の例を示す。 入力符号語および予測符号語の分布および相関の例を示す。 入力符号語および予測符号語の分布および相関の例を示す。
例示的な単層後方互換(SLBC)コーデックを示す。 例示的な単層逆表示管理(SLiDM)コーデックを示す。
例示的なプロセス・フローを示す。 例示的なプロセス・フローを示す。
本明細書に記載されるコンピュータまたは計算デバイスが実装され得る例示的なハードウェアプラットフォームの簡略化されたブロック図を示す。
以下の説明において、説明の目的で、本開示の完全な理解を提供するために、多数の具体的な詳細が記載される。しかしながら、本開示は、これらの具体的な詳細なしに実施することができることは明らかであろう。他の例では、本開示を不必要に閉塞、不明瞭化、または不明確化することを避けるために、周知の構造およびデバイスは、徹底的に詳細には記載されていない。
本明細書に記載されるカスケード予測方法は、後方互換性をサポートするものを含むが、これに限定されない、広範なビデオ配信および表示用途で実施および実行することができる。いくつかの操作シナリオでは、ベース層(BL)画像データは、コーディングされたビットストリーム中の(例えば、第1のダイナミックレンジの、第1の色空間中の、第1のElectro-Optic Transfer Function又はEOTF対応する、等の)第1のドメイン内に、画像メタデータとともにエンコードされてもよく、画像メタデータは、第1のドメイン内にエンコードされたBL画像データから、(例えば、第2のダイナミックレンジの、第2の色空間中の、第2のEOTFに対応する、等の)第2のドメイン内にコーディングされた画像データを生成/再構成するために使用される。BL画像データおよび画像メタデータは、受信側のデコーディングおよび再生デバイスへ提供され得、それらのデバイスは、第1のドメイン内の画像の描画をサポートするディスプレイ上でデコードした後に(例えば、第1のダイナミックレンジの、第1の色空間中の、第1のEOTFに対応する、等の)BL画像データを直接描画してもよいし、またはデコードされたBL画像データおよび画像メタデータから第2のドメイン内の画像データを再構成し、第2のドメイン内の画像の描画をサポートするディスプレイ上で(例えば、第2のダイナミックレンジの、第2の色空間中の、第2のEOTFに対応する、等の)再構成画像データを描画してもよい。第1のドメイン内のBLまたは入力画像データと、第2のドメイン内の再構成または出力画像データとは、異なるダイナミックレンジであってもよい。さらに、任意にまたは代替として、第1のドメイン内のBLまたは入力画像データと第2のドメイン内の再構成または出力画像データとは同じダイナミックレンジであってもよいが、BLまたは入力画像データと再構成または出力画像データとは異なる色空間にあってもよく、および/または異なるEOTFに対応してもよい。例えば、第1のドメイン内のBL又は入力画像データは、HLG EOTFに対応するR.2020色空間において最大輝度1000ニトのダイナミックレンジであってもよく、一方、再構成又は出力画像データは、PQ EOTFに対応するR.2020色空間において最大輝度1000ニトの同じダイナミックレンジであってもよい。この実施例では、第1のドメインおよび第2のドメインは、両方とも、最大輝度1000ニトと同じダイナミックレンジを有し、同じ色空間内にあるが、BLまたは入力画像データおよび再構成または出力画像データは、異なるEOTFに従ってコーディングされてもよく、または異なるEOTFに対応してもよい。従って、画像データが表現される/コーディングされるドメインのうちの少なくとも1つの属性(例えば、ダイナミックレンジ、色空間またはEOTF)が、BLまたは入力画像データと、再構築または出力画像データとの間で異なる限り、本明細書に記載されるカスケード予測方法が適用され得る。その結果、コーディングされたビットストリーム中の、いくつかの表示デバイスによってサポートされるあるドメインに対してコーディングされた画像データを使用して、コーディングされたビットストリーム中の、他のいくつかの表示デバイスによってサポートされる他の1つ以上のドメインに対する再構成画像データを、上記他の1つ以上のドメインに対する他の画像データを必要とすることなく、生成することができる。いくつかの操作シナリオでは、種々のドメインにおける表示または画像処理操作をサポートする多様な表示デバイスタイプが、本明細書に記載される技術の下で生成されるコーディングされたストリームによってサポートされてもよい。
いくつかの操作シナリオでは、カスケード予測係数の複数の異なる組が生成されて、再構成画像データにおける様々なビデオ品質レベルをサポートし得る。例えば、カスケード予測係数の第1の組を使用して、再構成画像データを有する第1の予測ビデオ信号を構築し、第1のビデオ品質レベルをサポートすることができる。カスケード予測係数の第2の組を使用して、リファインメント信号を構築し、それを第1の予測信号と組み合わせると、再構成画像データを有する第2の予測信号を発生させ、第1のビデオ品質レベルよりも高い第2のビデオ品質レベルをサポートすることができる。異なる組のカスケード予測係数を使用して、異なるバージョンのビデオデコーダまたは再生デバイスをサポートすることができる。それらのビデオデコーダまたは再生デバイスのうちのいくつかは、フィールドに広く配置されてもよいが、カスケード予測係数の第1の組のみを認識し、それに応じて予測操作にカスケード予測係数の第1の組を適用してもよい。比較的進歩したビデオデコーダまたは再生デバイスによる予測操作において、予測係数の追加の組が認識され、適用されるとき、ビデオ品質レベルは、徐々に改善され得る。
本明細書に記載する例示的な実施形態は、画像再構成のためのカスケード予測メタデータの生成およびエンコードに関する。第1の予測子は、第1のドメイン内にコーディングされた入力画像に適用され、第1のドメインとは異なる第2のドメイン内にコーディングされた予測標的画像の予測標的符号語に近似する第1段階の予測符号語を生成する。第2段階の予測標的値は、予測標的符号語と第1段階の予測符号語に対して逆カスケード演算を行うことによって作成される。第1のドメイン内の入力画像に第2の予測子を適用し、第2段階の予測標的値に近似する第2段階の予測値を生成する。カスケード予測係数の複数の組が生成され、第1の予測子を規定するカスケード予測係数の第1の組と、第2の予測子を規定するカスケード予測係数の第2の異なる組とを含む。カスケード予測係数の複数の組は、画像メタデータとしてビデオ信号内にエンコードされる。ビデオ信号は、第1のドメイン内の入力画像を以てさらにエンコードされる。ビデオ信号の受信デバイスは、複数の組のカスケード予測係数を使用して、第1の予測子および第2の予測子を入力画像に適用し、第2のドメイン内の予測画像を生成する。第2のドメイン内の予測画像は、第2のドメイン内の予測標的画像に近似する。
本明細書に記載する例示的な実施形態は、画像の再構成および描画のためのカスケード予測メタデータのデコードに関する。第1のドメイン内にコーディングされた入力画像は、ビデオ信号からデコードされる。カスケード予測係数の複数の組を含む画像メタデータは、ビデオ信号からデコードされる。カスケード予測係数の複数の組は、上流の画像処理デバイスによって生成されたものであり、第2のドメイン内にコーディングされた予測標的画像に少なくとも部分的に基づいて生成され、第1の予測子を規定する、カスケード予測係数の第1の組と、第2のドメイン内の予測標的画像に少なくとも部分的に基づいて生成され、第2の予測子を規定する、カスケード予測係数の第2の組と、を含む。第1のドメインは、第2のドメインとは異なる。第1の予測子と第2の予測子は、カスケード演算によって結合されて、第1のドメイン内の入力画像に適用され、第2のドメイン内の予測標的画像に近似する第2のドメイン内の再構成画像を生成する。第2のドメイン内の再構成画像から導出された表示画像は、表示デバイスを用いて描画される。
例示的なビデオ配信処理パイプライン
図1Aは、ビデオキャプチャからビデオコンテンツ表示までの様々な段階を示す、ビデオ配信パイプライン(100)の例示的なプロセスを描く。一連のビデオフレーム(102)は、画像生成ブロック(105)を用いてキャプチャまたは生成される。ビデオフレーム(102)は、ビデオデータ(107)を提供するために、デジタル的に(例えば、デジタルカメラなどによって)キャプチャされてもよく、またはコンピュータによって(例えば、コンピュータアニメーションなどを使用して)生成されてもよい。さらに、任意にまたは代替として、ビデオフレーム(102)は、フィルムカメラによってフィルム上にキャプチャされてもよい。フィルムは、ビデオデータ(107)を提供するためにデジタルフォーマットに変換することができる。制作フェーズ(110)では、ビデオデータ(107)は、ビデオ制作ストリーム(112)を提供するように編集される。
次に、制作ストリーム(112)のビデオデータが、制作後編集(115)のためにプロセッサに提供される。制作後編集(115)は、ビデオ作成者の創造的意図に従って、画像の画質を向上させるか、または画像の特定の外観を達成するために、画像の特定の領域における色または輝度を調整または修正することを含んでもよい。これは、「カラータイミング」または「カラーグレーディング」と呼ばれることがある。他の編集(例えば、シーン選択およびシーケンス、手動および/または自動シーンカット情報生成、画像クロッピング、コンピュータ生成された視覚的特殊効果の追加など)は、HDR画像(117-1)またはSDR(または比較的狭いダイナミックレンジの)画像(117)のリリースバージョン(例えば、SDRなど)を生成するために、制作後編集(115)で実行され得る。いくつかの実施形態において、制作後編集(115)中に、HDR画像(117-1)は、高いダイナミックレンジをサポートする基準HDRディスプレイ上で、HDR画像(117-1)に関する制作後編集操作を実行しているカラリストによって、検討される。さらに、任意に、または代替として、制作後編集(115)中に、SDR画像(117)は、SDR画像(117)について制作後編集操作を実行しているカラリストによって、標準ダイナミックレンジ(または比較的狭いダイナミックレンジ)をサポートする基準ディスプレイ(125)上で検討される。さらに、任意にまたは代替として、SDR画像(117)は、HDR画像(117-1)からコンテンツマッピングされてもよい。
いくつかの実施形態において、コーディングブロック(120)は、カスケード予測係数の複数の組を生成するためのカスケード予測操作の一部または全部を実行してもよい。コーディングブロック(120)は、制作後編集(115)からHDR画像(117-1)を受信し、HDR画像(117-1)を(前方)再成形SDR画像へ前方再成形する。前方再成形SDR画像は、カラーグレーディング操作から(入手可能な場合)SDR画像(117)に密接に近似し得る。例示のみの目的のために、コーディングブロック(120)は、SDR画像(例えば、前方再成形SDR画像など)及び画像メタデータを含むコーディングされたビットストリームを生成し、ここで、画像メタデータは、SDR画像からHDR画像を再構成するために、コーディングされたビットストリームの受信デバイスによって使用される。しかしながら、様々な実施形態において、第1のドメイン内にコーディング/表現された画像データが、画像メタデータとともにコーディングされたビットストリーム中にエンコードされてもよく、ここで、画像メタデータは、第1のドメイン内の画像データから第2のドメイン内にコーディングされた画像データを再構成するために、コーディングされたビットストリームの受信デバイスによって使用されてもよいことに留意されたい。
いくつかの実施形態では、コーディングブロック(120)は、コーディングされたビットストリーム(122)を生成するために、ATSC、DVB、DVD、Blu-Ray、および他の配信フォーマットによって規定されるようなオーディオおよびビデオエンコーダを含んでもよい。
前方再成形SDR画像は、コーディングブロック(120)によって、コーディングされたビットストリーム(122)に圧縮/エンコードすることができる。カスケード予測係数の複数の組は、画像メタデータの一部として、同一のコーディングされたビットストリームに含まれるか、またはエンコードされてもよい。
コーディングされたビットストリーム(122)は、広範囲のSDR表示デバイス(例えば、SDRディスプレイなど)と後方互換性のあるビデオ信号(例えば、8ビットSDRビデオ信号、10ビットSDRビデオ信号など)を表すことができる。非限定的な例では、再成形SDR画像を以てエンコードされたビデオ信号は、単一層の後方互換性ビデオ信号であってもよい。本明細書において、「単一層の後方互換ビデオ信号」は、単一信号層におけるSDRディスプレイ用に特に最適化された、またはカラーグレード付けされたSDR画像を搬送するビデオ信号を指すことができる。例示的な単一層ビデオコーディング操作については、2016年3月23日に出願された米国仮特許出願第62/312,450号に記載されており、米国特許出願公報第2019/011054号として2019年4月11日に公開されてもおり、それらの全体の内容は、本明細書に完全に記載されているかのように、参照により本明細書に組み込まれる。
カスケード予測係数の複数の組は、デコードされ、ビデオ信号またはコーディングされたビットストリームの受信デバイスによってカスケード予測操作に使用され、デコードされた前方再成形SDR画像から再構成HDR画像を生成する。再構成HDR画像は、カラーグレーディングされたHDR画像(117-1)における対応する入力またはソースHDR画像に近似し得る。(上流の)コーディングブロック(120)によって生成されたカスケード予測係数の複数の組を有するカスケード予測操作(例えば、後方再成形操作、逆トーンマッピング操作など)を用いて、再構成HDR画像に対して異なるビデオ品質レベルを生成することができる。本明細書で使用される「後方再成形」とは、第1のダイナミックレンジの(例えば、コーディングされたビットストリーム中にあるか、又はその中にエンコードされている)画像を、第2のより高いダイナミックレンジの画像に変換する画像処理操作を指す。前方再成形とは、第2のダイナミックレンジの画像を、第1のより高いダイナミックレンジの(例えば、コーディングされたビットストリーム中にあるか、又はその中にエンコードされている)画像に変換する画像処理操作を指す。例示的な再成形操作は、2015年3月20日に出願された米国仮出願第62/136,402号(米国特許出願公開第2018/0020224号として2018年1月18日にも公開)に記載されており、その内容全体は、本明細書に完全に記載されているかのように、参照により本明細書に組み込まれる。
さらに、任意に、または代替的に、コーディングされたビットストリーム(122)は、表示管理(DM)メタデータを含むが、これらに限定されない付加的な画像メタデータを以てエンコードされ、ここで、表示管理メタデータは、下流のデコーダによって使用され、HDR基準ディスプレイのための後方再成形画像上の表示管理操作を実行して、非基準HDRディスプレイなどの他のディスプレイ上での描画に最適化された表示画像を生成することができる。
次いで、コーディングされたビットストリーム(122)は、デコーディングおよび再生デバイス、メディアソースデバイス、メディアストリーミングクライアントデバイス、テレビセット(例えば、スマートテレビなど)、セットトップボックス、映画館などの受信機へ向かって下流に配信される。受信機(または下流デバイス)において、コーディングされたビットストリーム(122)は、デコーディングブロック(130)によってデコードされ、デコードされた画像182を生成する。このデコードされた画像182は、コーディングブロック(120)によって実行される圧縮およびデコーディングブロック(130)によって実行される復元において生成される量子化エラーに応じて、再成形SDR画像と同じであってもよい。
受信機が、標準ダイナミックレンジ又は標準ダイナミックレンジに匹敵するかそれ未満の比較的狭いダイナミックレンジをサポートする標的ディスプレイ140と共に動作する(または接続されており、または動作的にリンクされている)という操作シナリオにおいて、デコーディングブロック(130)は、コーディングされたビットストリーム(122)(中の、例えば、単一の層)から再成形SDR画像をデコードし、標的ディスプレイ(140)上に描画するために、デコードされた再成形SDR画像を直接的又は間接的に使用することができる。標的ディスプレイ(140)がSDR基準ディスプレイ(125)と同様の特性を有する実施形態では、再成形されたSDR画像は、標的ディスプレイ(140)上で直接観察可能である。
いくつかの実施形態では、受信機は、(例えば、400ニト、1000ニト、4000ニト、10000ニト以上など)高いダイナミックレンジをサポートするHDR標的ディスプレイ140-1と共に動作して(または接続されており、または動作的にリンクされていて)、コーディングされたビットストリーム(122)(の中の、例えば、メタデータコンテナ等)から画像メタデータを抽出し、画像メタデータ(または構成メタデータ)中のカスケード予測係数の複数の組のうちの2つ以上を使用して、画像メタデータ(構成メタデータ)に少なくとも部分的に基づいて再成形SDR画像に対して―カスケード予測操作の実行を含むが、それに限定されない―後方再成形をすることによって再成形SDR画像から後方再成形画像132-1を構成することができる。
いくつかの操作シナリオでは、後方再成形画像(132-1)は、受信機と共に動作するHDR標的ディスプレイと同じか、またはそれに匹敵するHDR(例えば、基準、などの)ディスプレイ上での表示に最適化された再構成HDR画像を表す。受信機は、HDR標的ディスプレイ上での描画のために、後方再成形画像(132-1)を直接使用することができる。
いくつかの操作シナリオでは、後方再成形画像(132-1)は、受信機と共に動作するHDR標的ディスプレイ(140-1)と同じではないHDR(例えば、基準、などの)ディスプレイ上での表示に最適化された再構成HDR画像を表す。表示管理ブロック(例えば、135-1など)は、受信機内、HDR標的ディスプレイ(140-1)内、または別のデバイス内にあってもよく、HDR標的ディスプレイ(140-1)の特性に適合した表示マッピング信号(137-1)を生成することにより、HDR標的ディスプレイ(140-1)の特性に合わせて、後方再生成画像(132-1)をさらに調整する。表示画像または調整された後方再成形画像がHDR標的ディスプレイ(140-1)上に表示されてもよい。
ビデオコーデックとカスケード予測
図1Bは、デコーダ側における例示的な2段階カスケード予測操作を示す。示されるように、入力信号は、第1の予測ブロック(「予測1」と表記)に入力として供給され、これは、出力として第1の予測(ビデオ)信号(「予測信号1」と表記)を生成する。また、入力信号は、第2の予測ブロック(「予測2」と表記)に入力として供給され、出力として予測残留(ビデオ)信号を生成する。第1の予測ブロックから出力された第1の予測信号と、第2の予測ブロックによって生成された予測残留信号とは、カスケード演算ブロックに入力として供給され、入力された信号に対してマージ操作(例えば、加算、乗算など)を行い、第2の予測(ビデオ)信号(「予測信号2」と表記)を出力として生成する。第2の予測信号は、第1の予測信号および第2の予測信号の各々が近似するようにタスクされるソースまたは入力(ビデオ)信号に関して、第1の予測信号よりも高精度および良品質の再構成ビデオ信号を表す。
いくつかの操作シナリオでは、図1Bの第1の予測ブロックは、8ピースの2次多項式を用いて色空間(例えば、YCbCrなど)の輝度チャネル(「Y」と表記)において、MMR係数を用いて色空間の色度チャネル(「Cb」または「C0」、「Cr」または「C1」と表記)において予測操作を実行する。図1Bの第2の予測ブロックは、MMR(多重カラーチャネル多重回帰)係数またはTPB(テンソル積B-スプライン)予測係数を用いて輝度および色度チャネルの一部または全部において予測操作を実行する。MMRベースの予測が第1および第2の予測ブロックの両方で使用されるシナリオにおいて、MMRベースの予測を実行するいくつかまたは全ての処理ロジックは、これらの予測ブロックで再利用され得る。例示的な累積密度関数(CDF)マッチング操作は、2017年9月11日に出願されたPCT出願第PCT/US2017/50980号、および(米国特許出願公開第2018/0098094号として2018年4月5日に公開もされている)2016年10月5日に出願された米国仮出願第62/404,307号に記載されており、それらの内容全体は、参照により本明細書に組み込まれる。MMR操作の例は、米国特許第8,811,490号に記載されており、これは、本明細書に完全に記載されているかのように、その全体が参照により援用される。TPB操作の例は、2019年10月1日に出願された「TENSOR-PRODUCT B-SPLINE PREDICTOR」というタイトルの米国仮出願番号第62/908,770号(代理人番号第60175-0417号)に記載されており、これは、本明細書に完全に記載されているかのように、その全体が参照により援用される。
図1Cは、関数の関数モデルに基づく例示的な2段階予測を示す。このモデルでは、第1の予測ブロックの出力は、第2の予測ブロックに直接供給される。いくつかの操作シナリオでは、このモデルにおける予測操作は、第1の予測ブロックによって得られたものを超える追加の情報を全く、あるいはほとんど得ることはない。対照的に、図1Bに示すようなカスケードモデルでは、第2の予測ブロックは、入力(またはソース)信号から直接オリジナルの画像データを受信する。従って、第2の予測ブロックは、第1の予測ブロックによって生成された予測誤差または不正確さを補正するのに良好な位置である。
本明細書に記載されるようなカスケード予測によって生み出される例示的な長所および利点は、(1)既存のコーデックアーキテクチャへの後方互換性、及び(2)比較的低い(例えば、処理の、全体の、などの)遅延および比較的独立した予測処理を提供するために活用または実行され得る、第1の予測ブロックおよび第2の予測ブロックに対する並列処理を含むが、これらに限定されるものではない。
図1Dは、カスケード予測のためのエンコーダ側アーキテクチャの例を示す。ビデオコーデック(例えば、ビデオエンコーダ、ビデオトランスコーダなど)は、ソース(ビデオ)信号および基準(ビデオ)信号を受信する。例示のみを目的として、ソース信号は、SDR画像(例えば、図1Aの122のようなコーディングされたビットストリーム中にエンコードされるべき、前方再成形SDR画像など)を含む。基準信号は、受信デバイスによってSDR画像から生成された再構成HDR画像が近似すべき基準HDR画像を含む。コーデックの目標は、ソース信号中のSDR画像にカスケード予測係数の複数の組のうちの1つ、複数、または全部を適用する場合に再構成HDR画像が基準信号中の基準HDR画像に(例えば、密接に、複数の品質レベル内の特定の品質レベルで、可能な限り密接に、など)近似するように予測(ビデオ)信号中に生成されるように、カスケード予測係数の複数の組を生成することである。
カスケード予測係数の複数の組のうちの(例えば、8ピースの2次多項式およびMMR係数などを規定する、などの)カスケード予測係数の第1の組は、第1の品質レベルで基準HDR画像に近似する第1の再構成HDR画像を生成するために、フィールド内に比較的広範囲に配置された受信デコーディングまたは再生デバイスの第1の集団によって使用され得る。
図1Dに示すように、コーデックは、基準信号及びソース信号を受信し、受信した基準信号及びソース信号に少なくとも部分的に基づいてカスケード予測係数の第1の組を生成し、(例えば、図1Aの122等の)コーディングされたビットストリーム中にソース信号と共にエンコードされるべき画像メタデータ(又は構成メタデータ)の一部としてカスケード予測係数の第1の組(「予測子1の係数」と表記)を出力し、カスケード予測係数の第1の組に少なくとも部分的に基づいてソース信号内のソース画像から生成される第1の予測(ビデオ)信号を生成及び出力するために、第1の予測ブロック(「予測子1」と表記)を使用することができる。
カスケード予測係数の複数の組のうちの(例えば、MMR係数またはTPB予測係数などを規定する、などの)カスケード予測係数の第2の組は、第1の組と共に、比較的進歩した受信デコーディングまたは再生デバイスの第2の集団によって使用されて、第1の品質レベルよりも高い第2の品質レベルで基準HDR画像に近似する第2の再構成HDR画像を生成することができる。
図1Dに示すように、コーデックは、2つの段階を用いて、カスケード予測係数の第2の組を生成する。第1の段階は、逆カスケード演算ブロックによって実行され、第2の基準信号を生成し、第2の予測ブロック(「予測2」と表記)に第2の基準信号を出力する。逆カスケード演算ブロックは、カスケード演算の逆(または反対)の逆カスケード演算を実行して、受信デコーダまたは再生デバイスによって適用されてもよい。逆カスケード演算ブロックによって生成された第2の基準信号を受信することに加えて、第2の予測ブロックは、第1の予測ブロックによって受信されたのと同じソース信号も受信する。第2の予測ブロックは、少なくとも部分的にはソース信号及び第2の基準信号に基づいてカスケード予測係数の第2の組を生成し、予測残留信号は、少なくとも部分的にはカスケード予測係数の第2の組に基づいてソース信号から生成されて、逆カスケード演算ブロックから出力される第2の基準信号に可能な限り密接に近似する。図1Dのコーデックは、受信デコーダまたは再生デバイスに配信されるべきコーディングされたビットストリーム内の画像メタデータの一部として、カスケード予測係数の第2の組(「予測子2の係数」と表記)を(例えば、オンデマンドに、動的に、静的に、など)含んでもよい。
図1Eは、カスケード予測のためのデコーダ側アーキテクチャの例を示す。ビデオコーデック(例えば、ビデオデコーダ、ビデオトランスコーダなど)は、受信した(例えば、図1Aの122などの)コーディングされたビットストリームを、(コーディング/デコーディングまたは圧縮/解凍によって生じる量子化/コーディングエラーに応じてソース信号と同じであってもよい)ソース信号のデコードバージョン、及び上流のコーデック(例えば、図1D、コーディングブロック(120)など)によって生成されたカスケード予測係数の複数の組のうちの1つ以上の組へデコードする。
カスケード予測係数の複数の組のうちの1つ以上は、カスケード予測係数の第1の組を含む。図1Eのコーデックの第1の予測ブロック(「予測1」と表記)は、ソース信号(またはそのデコードバージョン)およびカスケード予測係数の第1の組(「予測子1の係数」と表記)を受信し、少なくとも部分的にカスケード予測係数の第1の組に基づいて、ソース信号中のSDR画像から(第1の予測基準信号において)第1の再構成HDR画像を生成することができる。第1の再構成HDR画像は、第1の品質レベルで(図1Dの基準信号における)基準HDR画像に近似する。
いくつかの操作シナリオでは、図1Eのコーデックは、第1の再構成HDR画像に基づいて第1の表示画像を導出し、カスケード予測係数の第1の組以外のカスケード予測係数のさらなる組を必要とすることなく、HDR表示デバイス上に第1の表示画像を描画する。
いくつかの操作シナリオでは、図1Eのコーデックは、受信したコーディングされたビットストリームからカスケード予測係数の第2の組(「予測子2の係数」と表記)をデコードし、予測2を使用する。予測2は、ソース信号(またはそのデコードバージョン)およびカスケード予測係数の第2の組を入力として受信し、少なくとも部分的にカスケード係数の第2の組に基づいてソース信号から予測残留信号を生成する。予測残留信号は予測2によりカスケード演算ブロック(「予測2」と表記)に出力されてもよい。第1の予測信号は、第1の予測ブロックによってカスケード演算ブロックに出力され、カスケード演算ブロックは、予測残留信号を第1の予測信号と組み合わせて、第2の予測信号を生成する。第2の予測信号は、第1の品質レベルよりも高い第2の品質レベルで基準HDR画像に近似する第2の再構成HDR画像を含む。
エンコーダでの前方および後方マッピングにおけるカスケード予測
いくつかの操作シナリオでは、本明細書に記載のビデオエンコーダは、エンコーダによって実行される全体的な画像処理操作の一部として、(HDR-to-SDR)前方マッピングと(SDR-to-HDR)後方マッピングの両方を実行することができる。例えば、エンコーダは、基準(または入力)HDRビデオ信号およびコンテンツマッピングされたSDRビデオ信号を受信することができる。これらのビデオ信号のうちの1つ以上は、例えば、SDR基準ディスプレイ、HDR基準ディスプレイ、SDRおよびHDR基準ディスプレイの両方、などを用いてカラリストによって実行される、カラーグレーディング操作の結果であってもよい。さらに、任意にまたは代替的に、これらのビデオ信号のうちの1つのビデオ信号の中の画像データは、その他のビデオ信号の中の対応する画像データから、例えば、ユーザの介入または手動入力なしに完全に自動的に、ユーザの介入または手動入力を以て実質的に自動的な方法、またはユーザの介入および手動入力を伴って実質的に自動的な方法、などでコンテンツマッピングされてもよい。
カスケード予測は、エンコーダにおいて前方マッピングおよび後方マッピングに適用することができる。エンコーダにおけるカスケード予測の適用により、前方マッピングと後方マッピングの両方の精度と品質を改善できる。
エンコーダ側での前方マッピングまたは後方マッピングのいずれかに本明細書に記載されるようなカスケード予測を適用するために、図1Dに描かれるものと同一または類似の複数段階(またはカスケード)予測を実現して実行することができる。
エンコーダでの前方マッピングにおけるカスケード予測
(ビデオエンコーダによって受信される)入力SDRビデオ信号中のj番目の入力SDR画像および(ビデオエンコーダによって受信される)入力HDRビデオ信号中のj番目の入力HDR画像(それは入力SDR画像と同じ視覚的意味内容を表すが、より高い輝度のダイナミックレンジを有する)のそれぞれにP個の画素があると仮定する。
トリプレット
Figure 0007434554000001
および
Figure 0007434554000002
を、それぞれ、j番目のSDR画像およびHDR画像のi番目の画素についての(YCbCrやYCのような色空間の)正規化されたY、C、およびC値を表すとする。
色空間のルマまたは輝度チャネル(Yと表記)では、単一チャネル輝度予測操作を実行して、HDR符号語
Figure 0007434554000003
を、輝度前方再成形関数
Figure 0007434554000004
を使用して、SDR符号語
Figure 0007434554000005
に近似するように、以下のように、予測またはマッピングされたSDR符号語(
Figure 0007434554000006
と表記)にマッピングまたは前方再成形することができる。
Figure 0007434554000007
輝度前方再成形関数は、HDR輝度符号語/輝度値から予測またはマッピングされたSDR輝度符号語/輝度値への1対1のマッピングを提供する一次元ルックアップ表(1D-LUT)―またはFLUT―であってもよい。輝度前方再成形関数は、予測のための(例えば、マッピングされるべきHDR符号語
Figure 0007434554000008
を含む、などの)入力としての入力HDR信号と、予測のための(例えば、予測SDR符号語
Figure 0007434554000009
によって近似されるべきSDR符号語
Figure 0007434554000010
を含む、などの)基準としての入力SDR信号とを使用して生成されてもよい。
しかしながら、画素の輝度符号語/輝度値/輝度強度は、画素の色度成分によって影響されることが多い。単一チャネル輝度前方再生成関数は、画素の色度成分と輝度成分との間のクロスカラー情報あるいは影響を取り込むのに適していない場合がある。その結果、予測SDR符号語
Figure 0007434554000011
は、予測SDR符号語
Figure 0007434554000012
によって近似されるべき入力SDR符号語
Figure 0007434554000013
によって表される期待SDR符号語から逸脱し得る。
単一チャネル輝度前方再成形関数に関連する欠点を克服するために、単一チャネル輝度前方再成形関数は、第1の予測標的値を含む第1の予測標的信号としての入力SDR信号を以て生成される第1の輝度前方予測関数として(例えば、ただ単に、など)みなすことができる。第2の輝度前方予測関数
Figure 0007434554000014
は、輝度成分へ色度情報または影響をさらに組み込む(又はより良く取り込む)ために使用することができる。
第2の輝度前方予測関数を使用して生成された第2の予測値が近似すべき第2の予測標的値を含むべく、第2の予測標的信号(
Figure 0007434554000015
と表記)が、以下のように生成されてもよい。
Figure 0007434554000016
ここで、式(2)の右辺の演算子「-」は逆カスケード演算子OP-1()を表す。例示のみを目的として、逆カスケード演算子OP-1()は、式(2)において減算演算子として表される。様々な実施形態において、本明細書に記載される逆カスケード演算子は、減算演算子、除算演算子、可逆演算子、関数ベースの演算子などとして表され得ることに留意されたい。
第2の輝度前方予測関数(
Figure 0007434554000017
と表記)は、入力HDR画像内のHDR輝度及び/又は色度符号語(例えば、
Figure 0007434554000018
など)-またはその特定の関数-を入力として使用し、第2の予測標的信号
Figure 0007434554000019
を予測標的として使用して生成することができる。一旦生成されると、第2の輝度前方予測関数
Figure 0007434554000020
を使用して、入力HDR画像内のHDR輝度および色度符号語
Figure 0007434554000021
-またはそれらの特定の関数-を、以下のように、予測符号語残差
Figure 0007434554000022
にマッピングすることができる。
Figure 0007434554000023
全体的な輝度前方予測関数(
Figure 0007434554000024
と表記)は、カスケード演算子OP()で結合された第1および第2の輝度前方予測関数の両方として、以下のように与えられてもよい。
Figure 0007434554000025
ここで、式(4)の右辺の演算子「+」は、式(2)の逆カスケード演算子OP-1()の逆であるカスケード演算子OP()を表す。例示のみを目的として、カスケード演算子OP()は式(4)で加算演算子として表現される。種々の実施形態において、本明細書に記載されるカスケード演算子は、式(4)に表されるカスケード演算が式(2)の逆カスケード演算に共役である限り、加算演算子、乗算演算子、可逆演算子、関数ベース演算子などとして表され得ることに留意されたい。
より具体的には、SDR輝度チャネル内の全体的にマッピングされた(または全体的に前方再成形された)SDR符号語/値を含む前方再成形SDR信号は、以下のように、予測残基としての―第2の輝度前方予測関数を入力HDR信号に適用することによって生成された―第2のマップ値を、入力HDR信号に第1の輝度前方予測関数を適用することによって生成された第1のマップ値に加算することによって得ることができる。
Figure 0007434554000026
色度チャネル(または非輝度チャネル)における前方予測(または前方再成形における予測操作)は、輝度チャネルにおける前方予測について本明細書に記載されたものと同様のカスケードプロセスに従うことができる。様々な実施形態において、色度チャネルにおける前方予測は、輝度チャネルにおける前方予測に使用されるような予測関数と類似または異なる選択を使用することができる。例示として、限定ではないが、色度チャネルにおける前方予測は、色度チャネルにおけるSDR色度符号語/色度値を予測するために、第1の色度予測関数を(2次のMMR係数で規定される)2次のMMR演算子と選択し、さらに、色度チャネルにおける残留SDR色度符号語/色度値を予測するために、第2の色度予測関数を(3次のMMR係数で規定される)3次のMMR演算子、または何らかの他の演算子(例えば、2次のMMR演算子以外、など)を選択してもよい。
本明細書に記載されるカスケード前方予測によって生成された前方再成形SDR符号語/値を含む前方再成形SDR画像のSDR信号は、前方再成形SDR画像から再構成HDR画像を生成および描画するための後方再成形メタデータと共に、コーディングされたビットストリーム(例えば、図1Aの122など)にエンコードされて、下流のデコーダおよび/または再生デバイスに配信されてもよい。
エンコーダでの後方マッピングにおけるカスケード予測
SDRビデオ信号中の(後方再成形される)j番目のSDR画像と、HDRビデオ信号中の(対応する予測標的の)(SDR画像と同じ視覚的意味内容を表すが、輝度ダイナミックレンジがより高い)j番目のHDR画像のそれぞれにP個の画素があると仮定する。
トリプレット
Figure 0007434554000027
および
Figure 0007434554000028
を、それぞれ、j番目のSDR画像およびHDR画像のi番目の画素についての(YCbCrやYCのような色空間の)正規化されたY、C、およびC値を表すとする。
色空間のルマまたは輝度チャネル(Yと表記)では、単一チャネル輝度予測操作を実行して、SDR符号語
Figure 0007434554000029
を、輝度後方再成形関数
Figure 0007434554000030
を使用して、HDR符号語
Figure 0007434554000031
に近似するように、以下のように、予測またはマッピングされたHDR符号語(
Figure 0007434554000032
と表記)にマッピングまたは後方再成形することができる。
Figure 0007434554000033
輝度後方再成形関数は、SDR輝度符号語/輝度値から予測またはマッピングされたHDR輝度符号語/輝度値への1対1のマッピングを提供する一次元ルックアップ表(1D-LUT)―またはBLUT―であってもよい。輝度後方再成形関数は、予測のための(例えば、マッピングされるべきSDR符号語
Figure 0007434554000034
を含む、などの)入力としての(後方再成形される)SDR画像と、予測のための(例えば、予測HDR符号語
Figure 0007434554000035
によって近似されるべきHDR符号語
Figure 0007434554000036
を含む、などの)基準としての(予測標的)HDR画像とを使用して生成されてもよい。
しかしながら、画素の輝度符号語/輝度値/輝度強度は、画素の色度成分によって影響されることが多い。単一チャネル輝度後方再生成関数は、画素の色度成分と輝度成分との間のクロスカラー情報あるいは影響を取り込むのに適していない場合がある。その結果、予測HDR符号語
Figure 0007434554000037
は、予測HDR符号語
Figure 0007434554000038
によって近似されるべきHDR符号語
Figure 0007434554000039
によって表される期待HDR符号語から逸脱し得る。
単一チャネル輝度後方再成形関数に関連する欠点を克服するために、単一チャネル輝度後方再成形関数は、第1の予測標的値を含む予測標的としての(予測標的)HDR画像を以て生成される第1の輝度後方予測関数として(例えば、ただ単に、など)みなすことができる。第2の輝度後方予測関数
Figure 0007434554000040
は、輝度成分へ色度情報または影響をさらに組み込む(又はより良く取り込む)ために使用することができる。
第2の輝度後方予測関数を使用して生成された第2の予測値が近似すべき第2の予測標的値を含むべく、第2の予測標的信号(
Figure 0007434554000041
と表記)が、以下のように生成されてもよい。
Figure 0007434554000042
ここで、式(7)の右辺の演算子「-」は逆カスケード演算子OP-1()を表す。例示のみを目的として、逆カスケード演算子OP-1()は、式(7)において減算演算子として表される。様々な実施形態において、本明細書に記載される逆カスケード演算子は、減算演算子、除算演算子、可逆演算子、関数ベースの演算子などとして表され得ることに留意されたい。さらに、任意に、または代替として、様々な実施形態において、前方再成形および後方再成形において、類似の、または異なるタイプの逆カスケード演算子を使用してもよい。従って、前方再成形および後方再成形において、同一のタイプの逆カスケード演算を使用する必要はない。
第2の輝度後方予測関数(
Figure 0007434554000043
と表記)は、(後方再成形される)SDR画像中の(後方再成形される)SDR輝度および色度の符号語(例えば、
Figure 0007434554000044
など)-またはその特定の関数-を入力として使用し、第2の予測標的信号
Figure 0007434554000045
を予測標的として使用して生成することができる。一旦生成されると、第2の輝度後方予測関数
Figure 0007434554000046
を使用して、(後方再成形される)SDR画像中の(後方再成形される)SDR輝度および色度符号語
Figure 0007434554000047
-またはそれらの特定の関数-を、以下のように、予測符号語残差
Figure 0007434554000048
にマッピングすることができる。
Figure 0007434554000049
全体的な輝度後方予測関数(
Figure 0007434554000050
と表記)は、逆カスケード演算子OP()で結合された第1および第2の輝度後方予測関数の両方として、以下のように与えられてもよい。
Figure 0007434554000051
ここで、式(9)の右辺の演算子「+」は、式(7)の逆カスケード演算子OP-1()の逆であるカスケード演算子OP()を表す。例示のみを目的として、カスケード演算子OP()は式(9)で加算演算子として表現される。種々の実施形態において、本明細書に記載されるカスケード演算子は、式(9)に表されるカスケード演算が式(7)の逆カスケード演算に共役である限り、加算演算子、乗算演算子、可逆演算子、関数ベース演算子などとして表され得ることに留意されたい。さらに、任意に、または代替として、様々な実施形態において、類似の、または異なるタイプのカスケード演算子を前方再成形および後方再成形において使用してもよい。従って、前方再成形および後方再成形において同一のタイプのカスケード演算を使用する必要はない。
より具体的には、HDR輝度チャネル内の全体的にマッピングされた(または全体的に後方再成形された)HDR符号語/値を含む後方再成形HDR信号は、以下のように、予測残基としての―第2の輝度後方予測関数を(後方再成形される)SDR信号に適用することによって生成された―第2のマップ値を、(後方再成形される)SDR信号またはその中のSDR画像に第1の輝度後方予測関数を適用することによって生成された第1のマップ値に加算することによって得ることができる。
Figure 0007434554000052
色度チャネル(または非輝度チャネル)における後方予測(または後方再成形における予測操作)は、輝度チャネルにおける後方予測について本明細書に記載されたものと同様のカスケードプロセスに従うことができる。様々な実施形態において、色度チャネルにおける後方予測は、輝度チャネルにおける後方予測に使用されるような予測関数と類似または異なる選択を使用することができる。例示として、限定ではないが、色度チャネルにおける後方予測は、色度チャネルにおけるSDR色度符号語/色度値を予測するために、第1の色度予測関数を(2次のMMR係数で規定される)2次のMMR演算子と選択し、さらに、色度チャネルにおける残留HDR色度符号語/色度値を予測するために、第2の色度予測関数を(3次のMMR係数で規定される)3次のMMR演算子、または何らかの他の演算子(例えば、2次のMMR演算子以外、など)を選択してもよい。
第1の輝度および色度後方予測関数のような第1の後方成形マッピングを規定するカスケード予測係数(または予測操作パラメータ)の第1の組と、第2の輝度および色度後方予測関数のような第2の後方成形マッピングを規定するカスケード予測係数(または予測操作パラメータ)の第2の組は、(例えば、図1Aの122などの)コーディングされたビットストリーム中に(後方再成形される)SDR画像とともにエンコードされている画像メタデータの一部として含まれ、SDR画像から再構成HDR画像を生成および描画するために下流のデコーダおよび/または再生デバイスに配信されてもよい。
デコーダにおけるカスケード予測
いくつかの操作シナリオでは、図1Eに示すように、ビデオデコーダのようなコーデックは、SDRからHDRへの後方マッピングのみを実行する。例示のみを目的として、デコーダ側の後方マッピングは、まず、輝度の後方再成形(または輝度チャネル中の後方再成形)によって説明することができる。デコーダは、受信した(例えば、図1Aの122などの)コーディングされたビットストリームまたはその中の画像メタデータコンテナから、カスケード予測係数の複数の組をデコードまたは読取る。
カスケード予測係数の複数の組は、第1の予測操作のためのカスケード予測係数の第1の組と、第2の予測操作のためのカスケード予測係数の第2の組を含む。カスケード予測係数の第1の組は、例えば8ピースの2次多項式として第1の輝度後方予測関数
Figure 0007434554000053
を規定することができ、デコードされたSDR符号語
Figure 0007434554000054
を、カスケード予測係数の複数の組を生成する上流デバイスにおける予測標的(または基準)HDR信号における基準HDR画像に近似する予測HDR符号語
Figure 0007434554000055
に、以下のようにマッピングする。
Figure 0007434554000056
いくつかの操作シナリオでは、デコーダは、第1の輝度後方予測関数で生成された予測HDR輝度符号語
Figure 0007434554000057
を含む第1の予測/再構成HDR画像から表示画像を生成し、デコーダと共に動作する表示デバイスで表示画像を描画することができる。
いくつかの操作シナリオでは、デコーダは、カスケード予測係数の第2の組によって規定される第2の輝度後方予測関数
Figure 0007434554000058
を(例えば、同時に、並列処理で、など)使用して、(例えば、
Figure 0007434554000059
などの)デコードされたSDR輝度及び色度符号語、またはそれらの特定の関数から、以下のように差分信号(例えば、予測残差)
Figure 0007434554000060
を予測又は推定する。
Figure 0007434554000061
第2の輝度後方予測関数で生成された推定差分信号は、カスケード演算を使用して、第1の輝度後方予測関数で生成された予測HDR符号語
Figure 0007434554000062
に追加され、以下のように、さらに改善された予測信号(
Figure 0007434554000063
と表記)中に第2の予測または後方再成形HDR画像が得られる。
Figure 0007434554000064
第1及び第2の予測/再構成HDR画像の色度成分も同様に得ることができる。いくつかの操作シナリオでは、第1の色度後方予測関数/マッピングは、3チャネルのMMR予測子または関数であってもよい。第2の色度後方予測関数/マッピングは、異なる次数または異なるタイプのMMR予測子または関数、あるいは第1の色度後方予測関数/マッピングとは異なる(またはより進歩した)別の予測子/関数であり得る。
例示的なカスケード予測子と動作タイプ/カテゴリ
いくつかの操作シナリオでは、複数のカスケード予測子の中の第1のカスケード予測子は、必ずしも限定はされないが、比較的単純な予測子(例えば、単一チャネルの予測子、より低次の多項式、より低次のMMR演算子など)であってもよく、一方、複数のカスケード予測子の中の第2の又はさらなるカスケード予測子は、必ずしも限定はされないが、比較的複雑な又は高度な予測子(例えば、クロスチャネルの予測子、高次の多項式、高次のMMR演算子など)であってもよい。
いくつかの操作シナリオでは、複数のカスケード予測子の中の2つ以上のカスケード予測子は、必ずしも限定はされないが、同等の複雑さの予測子であってもよい。2つ以上のカスケード予測子は、多様であるか、あるいはタイプまたはカテゴリの点で異なってもよい。
単なる例示として、異なるタイプまたはカテゴリのカスケード予測子または演算を説明するための例として、HDR-to-SDRマッピング(例えば、後方再成形マッピングなど)が使用できる。様々な実施形態では、HDR-to-SDRマッピングに対するものと類似または異なるタイプまたはカテゴリのカスケード予測子または演算が、SDR-to-HDRマッピング(例えば、前方再成形マッピングなど)についても使用され得ることに留意されたい。
第1の例示的なタイプまたはカテゴリのカスケード予測子は、色度チャネル中の符号語から構成される単一の入力変数を有する多項式を使用する単一変数関数である。1つの入力変数のみを使用するため、彩度は多くの異なる候補のうちの1つの候補である。彩度(
Figure 0007434554000065
と表記)は、以下のように定義または計算される。
Figure 0007434554000066
第1の例示的なタイプのカスケード予測子は、式(14)の彩度を単一の入力変数として有する多項式によって表すことができ、
Figure 0007434554000067
と表記してもよい。そのようなカスケード予測子を表す多項式の多項式係数は、予測標的信号(例えば、近似されるべき信号など)および予測入力信号(例えば、前方再成形される信号、後方再成形される信号など)の関数として、誤差測定値/コストを最小化することによって得られる。
第2の例示的なタイプまたはカテゴリのカスケード予測子は、色度チャネル中の符号語を入力とするMMR予測子/関数である。入力変数の選択には、多くのオプションがある。
第1の例示的なオプションとして、2つの入力変数
Figure 0007434554000068
が、本明細書に記載されるように、MMR予測子/関数(
Figure 0007434554000069
と表記)において使用され得る。
第2の例示的なオプションとして、2つの入力変数
Figure 0007434554000070
が、本明細書に記載されるように、MMR予測子/関数(
Figure 0007434554000071
と表記)において使用され得る。
第3の例示的なオプションとして、3つの入力変数
Figure 0007434554000072
が、本明細書に記載されるように、MMR予測子/関数(
Figure 0007434554000073
と表記)において使用され得る。
第4の例示的なオプションとして、3つの入力変数
Figure 0007434554000074
が、本明細書に記載されるように、MMR予測子/関数(
Figure 0007434554000075
と表記)において使用され得る。入力変数
Figure 0007434554000076
は、特定の画素位置における局所変化を効率的にキャプチャするために使用され得る。
カスケード予測子を表すMMR予測子のMMR予測係数は、予測標的信号(例えば、近似されるべき信号など)および予測入力信号(例えば、前方再成形される信号、後方再成形される信号など)の関数として、誤差測定値/コストを最小化することによって得られてもよい。
第3の例示的なタイプまたはカテゴリのカスケード予測子は、色度チャネル中の符号語を入力とするTPB予測子/関数である。入力変数の選択には、多くのオプションがある。
第1の例示的なオプションとして、2つの入力変数
Figure 0007434554000077
が、本明細書に記載されるように、TPB予測子/関数(
Figure 0007434554000078
と表記)において使用され得る。
第2の例示的なオプションとして、2つの入力変数
Figure 0007434554000079
が、本明細書に記載されるように、TPB予測子/関数(
Figure 0007434554000080
と表記)において使用され得る。
第3の例示的なオプションとして、3つの入力変数
Figure 0007434554000081
が、本明細書に記載されるように、TPB予測子/関数(
Figure 0007434554000082
と表記)において使用され得る。
第4の例示的なオプションとして、3つの入力変数
Figure 0007434554000083
が、本明細書に記載されるように、TPB予測子/関数(
Figure 0007434554000084
と表記)において使用され得る。入力変数
Figure 0007434554000085
は、特定の画素位置における局所変化を効率的にキャプチャするために使用され得る。
カスケード予測子を表すTPB予測子のTPB予測係数は、予測標的信号(例えば、近似されるべき信号など)および予測入力信号(例えば、前方再成形される信号、後方再成形される信号など)の関数として、誤差測定値/コストを最小化することによって得ることができる。
さらに、任意に、または代替として、本明細書に示されているもの以外のカスケード予測子(例えば、非多項式、非MMR、非TPBなど)のタイプまたはカテゴリを、カスケード予測子のタイプまたはカテゴリで使用することができる。さらに、任意に、または代替として、本明細書に示されているもの以外の入力変数を、カスケード予測子のタイプまたはカテゴリで使用することができる。
様々な実施形態では、類似または異なるタイプまたはカテゴリのカスケード演算(例えば、可逆、正則など)およびそれらの共役または逆カスケード演算が使用されてもよい。
第1の例示的なカスケード演算は、
Figure 0007434554000086
におけるような(算術)加算である。第2の例示的なカスケード演算は、
Figure 0007434554000087
におけるような(算術)乗算である。
さらに、任意に、または代替として、本明細書に示されているもの以外のカスケード演算のタイプを、カスケード予測子のタイプまたはカテゴリで使用することができる。
多重カスケード予測
2段階カスケード予測は、3段階カスケード予測のような多重(または多段階)カスケード予測に拡張することができる。いくつかの操作シナリオでは、複数の区分的MMR演算子が、本明細書に記載されるように、カスケード予測において複数の予測子として生成され得る。さらに、任意に、または代替として、(例えば、シングルチャネル・マルチピース・MMR予測、マルチチャネル・シングルピース・MMR予測などの)MMR予測を導くための1D-LUTの作成の代わりに、またはそれに加えて、任意に、または代替として、カスケード予測を適用して、ピース・パーティションの境界で複数のMMR予測結果を融合するなどの特別な処理を行う必要なく、マルチチャネル・マルチピースMMR予測をサポートすることができる。例えば、異なるタイプのマルチチャネル・マルチピースMMR予測は、比較的高い計算効率及び比較的高い性能を有する異なる連続的又はカスケード予測段階で実施することができる。図1Fに示すように、第3の予測操作(「予測3」と表記)は、第1および第2の予測子
Figure 0007434554000088
をそれぞれ使用する第1および第2の予測操作(「予測1」および「予測2」とそれぞれ表記)に加えて、第3の予測子
Figure 0007434554000089
を使用してもよい。
前述のように、異なるタイプのカスケード演算が、本明細書に記載されるようなコーデックによって異なる操作シナリオにおいて使用され得る。限定ではなく例示として、2つの異なるタイプのカスケード演算子を使用することができる。
第一に、いくつかの操作シナリオでは、(算術)加算演算子をカスケード演算として使用して、図1Fの3つの予測操作からの予測値を以下のように組み合わせることができる。
Figure 0007434554000090
第二に、いくつかの操作シナリオでは、(算術)乗算演算子をカスケード演算として使用して、図1Fの3つの予測操作からの予測値を以下のように組み合わせることができる。
Figure 0007434554000091
(2段階カスケード予測と比較した)第3段階及び新しい段階の追加により、他の段階での他の予測操作によって見逃された画像データ中のいくつかの追加の構造、情報等がキャプチャされ得る。後の予測操作(本明細書に記載されるように、デコーダにおいて前の予測操作と完全に同時に実行され得る)は、前の予測操作とは異なる又は多様であるか、あるいは前の予測操作よりも進んでいるように選択され得る。新しい段階が加えられると、後続の予測操作によって予測されるその後の残留物は、よりランダムな雑音のようになり、それによって、より多くの新たな段階が加えられるにつれて、計算の複雑さを増加させながら、より少ないまたはより多くのあまり重要でない利益を提供する。
予測係数の導出
第1の予測子は、多項式、MMR、TPBなどで計算または表現され得る。限定ではないが、例示として、第2の予測子に対するカスケード予測係数(または演算パラメータ)の計算例が、(HDRからSDRへの)前方再成形に関して本明細書に記載される。
簡単のために、第2の予測子の標的信号を
Figure 0007434554000092
と表記し、第1の予測子
Figure 0007434554000093
からの(第1の)予測値を
Figure 0007434554000094
と表記する。したがって、以下が成り立つ。
Figure 0007434554000095
第1の予測子(または第1の予測操作)は、単一入力変数または複数入力変数の形式の入力を伴う単一チャネル多項式またはMMRに基づくことができる。(カスケード予測係数の第1の組を構成する)予測係数は、以下のように平均二乗誤差(MSE)として表されるものなどの誤差測定値/コストを最小化するための最適化プロセスを介して得られる。
Figure 0007434554000096
エンコーダ側では、元の予測標的(または基準)信号と、第1の予測子からの出力予測信号との間の差分などの残留信号(
Figure 0007434554000097
と表記)が決定され得る。第1及び第2の予測子と共に使用されるカスケード演算子又はカスケード演算のタイプ(例えば、可逆、など)に応じて、第2の予測操作において予測する第2の予測子に対して異なる予測標的(又は基準)値が決定され得る。
一例では、カスケード演算は算術加算である。したがって、対応する逆カスケード演算(または逆カスケード演算子)は、(算術)減算である。輝度チャネルにおける残留信号は、元の予測標的信号と第1の予測信号とから逆カスケード演算子を用いて以下のように計算され得る。
Figure 0007434554000098
別の例では、カスケード演算は算術乗算である。したがって、対応する逆カスケード演算(または逆カスケード演算子)は(算術)除算である。輝度チャネルにおける残留信号は、元の予測標的信号と第1の予測信号とから逆カスケード演算子を用いて以下のように計算され得る。
Figure 0007434554000099
第2の予測子(または予測操作)は、第2の予測関数によって以下のように表され得る。
Figure 0007434554000100
第2の予測子(または予測操作)は、元の入力値
Figure 0007434554000101
を用いて
Figure 0007434554000102
を予測することを目的としている。限定ではないが、例示として、第2の予測演算子のタイプは、MMR、TPB、または複数の入力変数の形式の入力を有する別のタイプとすることができる。第2の予測子に対する(カスケード予測係数の第2の組を構成する)予測係数は、以下のように、平均二乗誤差(MSE)として表されるものなどの誤差測定値/コストを最小化するための最適化プロセスを介して得られる。

Figure 0007434554000103
例えば、3チャネルMMRを例にとると、設計ベクトルは、入力ソース(例えば、前方再成形されるなどの)信号の多変量多項式のベクトルとして、以下のように構成することができる。
Figure 0007434554000104
すべての画素(又はSDR及びHDR画素対)についての式(23)の設計ベクトルを含む設計行列は、以下のように構成することができる。
Figure 0007434554000105
すべての画素(又はSDR及びHDR画素対)についてY、Cb、およびCrチャネルの第2の予測子で生成された値によって近似される値を含む基準(または予測標的)信号
Figure 0007434554000106
のY、Cb又はC1、およびCr又はC2成分は、以下のように構築され得る。
Figure 0007434554000107
第2の予測子は輝度チャネルと色度チャネルに対してMMR係数で以下のように規定される。
Figure 0007434554000108
ここで、MはMMR係数の総数(たとえば、7*MMR_ORDER+1)である。
式(25)の基準(又は予測標的)信号
Figure 0007434554000109
のY、Cb又はC0、およびCr又はC1成分の各々に近似する予測値は、MMR係数を用いて以下のように生成され得る。
Figure 0007434554000110
MMR係数を導出する目的で、すべての画素(または画素のビン)について全体的な近似誤差を最小化する最適化問題は、以下のように解くことができる。
Figure 0007434554000111
この最適化問題は、線形最小二乗解法によって、以下のように解くことができる。
Figure 0007434554000112
図2Aは、SDR画像内の輝度(Y)符号語/値(垂直軸で示される)の、SDR画像と同じ視覚コンテンツを描く対応するHDR画像内の対応する輝度(Y)符号語/値(水平軸で示される)に対する散布図の例を示す。
図2Bは、入力としてHDR画像を用い、予測輝度(Y)符号語/値によって近似される予測標的/基準としてSDR画像を用いて、第1の予測子又は予測操作(「予測子#1」と表記)によって生成される予測輝度(Y)符号語/値(垂直軸で示される)の、SDR画像内の対応する輝度(Y)符号語/値(水平軸で示される)に対する散布図の例を示す。
図2Cは、入力としてHDR画像を用い、逆カスケード演算によって生成され、第2段階の予測値によって近似された標的/基準値を用いて、第2の予測子または予測操作によって生成された第2段階の予測値(垂直軸で示される;「予測信号#2」と表記)の、第1の予測子または予測操作によって生成された予測輝度(Y)符号語/値(水平軸によって示される)に対する散布図の例を示す。
図2Dは、第1および第2の予測子または予測操作からの予測値を組み合わせることによって生成される全体的な予測輝度(Y)符号語/値(垂直軸で示される)の、SDR画像内の対応する輝度(Y)符号語/値(水平軸で示される)に対する散布図の例を示す。
第1の予測子または予測操作のみを使用する図2Bの散布図と比較すると、本明細書に記載のカスケード予測の下で第1および第2の予測子または予測操作の両方によって生成された全体的な予測輝度(Y)符号語/値は、SDR画像内の輝度(Y)符号語/値と比較的強い相関を示し、それによって全体の予測輝度(Y)符号語/値を含む予測画像での比較的高い精度および品質レベルを達成する。
アプリケーションアーキテクチャ
本明細書に記載のカスケード予測は、単一層の後方互換性(SLBC)ビデオアプリケーションおよび単一層の逆表示管理(SLiDM)ビデオアプリケーションをサポートするアプリケーションアーキテクチャを含むが、これらに限定されない、ビデオコーデックで実装された広範なアプリケーションアーキテクチャに組み込むことができる。
SLBCアーキテクチャ
図3Aは、例示的なSLBCコーデック(例えば、SLBCビデオエンコーダ、前方再成形経路及び後方再成形経路を含むSLBCビデオトランスコーダ)を示している。逆カスケード演算で結合された2段階のカスケード予測などのカスケード予測は、前方及び後方再成形経路の各々において(例えば、追加的に、任意に、又は代替的に、など)実行され得る。
図示のように、前方再成形経路におけるカスケード予測は、第1の前方予測操作(「前方予測1」と表記)および第2の前方予測操作(「前方予測2」と表記)を含む。後方再成形経路におけるカスケード予測は、第1の後方予測操作(「後方予測1」と表記)および第2の後方予測操作(「後方予測2」と表記)を含む。
前方再成形経路における予測子又は予測操作は、後方再成形経路における予測子又は予測操作に関して対称的である必要はなく、また、他の点で決定論的である必要はないことに留意されたい。例えば、第2の前方予測は、第1の後方予測と同一の予測である必要はなく、また第1の後方予測と共役な予測(例えば、逆向き予測、転置予測など)である必要もない。同様に、第1の前方予測は、第2の後方予測と同一の予測である必要はなく、また第2の後方予測と共役な予測(例えば、逆向き予測、転置予測など)である必要もない。
さらに、任意に、または代替として、異なるタイプのカスケード予測を、前方および後方再成形経路のそれぞれの2段階予測に使用することができる。例えば、前方及び後方再成形経路の各々について、比較的単純な予測子又は予測操作を第1段階に配置することができ、一方、異なる、比較的高度な予測子又は予測操作を、より単純な予測子又は予測操作の後の第2段階に配置して、追加の予測精度及び性能利得を得ることができる。
より具体的には、いくつかの操作シナリオでは、第2の前方予測子または予測操作は、第1の前方予測子または予測子操作とは異なるかまたは多様であるように選択され得る。同様に、第2の後方予測子または予測操作は、第1の後方予測子または予測操作とは異なるかまたは多様(または第1の後方予測子または予測操作よりさらに高度)であるように選択され得る。
前方再成形経路において、入力(またはソース)HDR信号(「HDR信号」と表記)における各HDR画像を構成する輝度および色度のHDR符号語/値は、前方再成形信号(「前方再成形SDR信号」と表記)中の対応する前方再成形SDR画像を構成する輝度および色度のSDR符号語/値に前方再成形することができる。前方再成形された輝度及び色度のSDR符号語/値は、対応する基準(又は標的)SDR信号(「SDR信号」と表記)中の対応する基準(又は標的)SDR画像における輝度及び色度のSDR符号語/値に近似する(例えば、密接に、様々な品質レベルで、など)。
限定ではないが例示として、前方(再成形)経路において、第1の前方予測子または予測操作は、以下のように、CDFマッチング技術から構築された第1の輝度前方予測子(例えば、関数、曲線、ルックアップ表、FLUTなど)を含む。
Figure 0007434554000113
ここで、
Figure 0007434554000114
は、第1の輝度前方予測子によって出力された第1の予測輝度符号語/値を表す。
第1の予測輝度符号語/値と、第1の予測輝度符号語/値によって近似される基準(または標的)SDR信号中の標的輝度符号語/値
Figure 0007434554000115
との間の予測誤差は、逆カスケード演算(それは、輝度固有、第1段階固有、エンコーダ固有などであってもよい)を使用して、以下のように生成され得る。
Figure 0007434554000116
予測誤差は、以下のように、第2の前方予測子または予測操作におけるMMRマッピングなどの第2の輝度前方予測子を用いて予測または近似される予測標的値として使用され得る。
Figure 0007434554000117
輝度チャネルの最終予測値
Figure 0007434554000118
は、第1および第2の輝度前方予測子の両方によって出力された予測値を、以下のように合計することによって生成される。
Figure 0007434554000119
同様に、前方(再成形)経路において、色度チャネルCb/C0およびCr/C1について、第1の前方予測子または予測操作は、以下のように、第1の色度前方予測子を含む。
Figure 0007434554000120
ここで、
Figure 0007434554000121
は、色度チャネルに対して単一段階MMR操作に基づいた第1の予測色度値を示す。
第1の予測色度符号語/値
Figure 0007434554000122
と、第1の予測色度符号語/値によって近似される基準SDR信号中の標的色度符号語/値
Figure 0007434554000123
との間の予測誤差は、各色度チャネルに対して、逆カスケード演算(それは、輝度固有、第1段階固有、エンコーダ固有などであってもよい)を使用して、以下のように生成され得る。
Figure 0007434554000124
予測誤差は、(使用される総段階数、使用される構成概念、マッピングおよび関数の次数、操作、入力変数の総数、入力変数の種類などに関して第1の色度前方予測子で使用されるものよりも)高度なMMRマッピングなどの第2の色度前方予測子を使用して、第2の前方予測子または予測操作において、以下のように予測または近似される予測標的値として使用され得る。
Figure 0007434554000125
色度チャネルについての最終的な予測値
Figure 0007434554000126
は、第1および第2の色度前方予測子の両方によって出力された予測値を、以下のように合計することによって生成される。
Figure 0007434554000127
いくつかの操作シナリオでは、式(33)および(37)における最終予測値は、前方再成形SDR画像/信号の一部としての前方再成形輝度および色度符号語/値として出力され得る。前方再成形画像/信号は、符号化されたビットストリーム(例えば、図1Aの122など)中にエンコードされ、後方再成形経路への入力として提供される。
後方再成形経路では、前方再成形SDR信号中の各前方再成形SDR画像を構成する前方再成形輝度及び色度SDR符号語/値は、再構成HDR信号中の対応する再構成HDR画像を構築する再構成輝度及び色度HDR符号語/値に後方再成形することができる。再構成または後方再成形された輝度および色度HDR符号語/値は、入力HDR信号中の対応する入力HDR画像における輝度および色度HDR符号語/値に近似する(例えば、密接に、様々な品質レベルで、など)。入力HDR信号も再構成HDR信号もコーディングされたビットストリーム中にエンコードされない。むしろ、カスケード予測操作の複数の組などの後方再成形マッピングを規定する画像メタデータ(または構成メタデータ)が、コーディングされたビットストリーム中に含まれる。コーディングされたビットストリームからHDR画像をデコードする代わりに、受信デコーダまたは再生デバイスは前方再成形SDR画像をデコードし、後方再成形マッピングを前方再成形SDR画像に適用することにより、前方再成形SDR画像から再構成HDR画像を生成する。
限定ではないが、例として、後方(再成形)経路において、第1の後方予測子または予測操作は、以下のように、CDFマッチング技術から構築された第1の輝度後方予測子(例えば、関数、曲線、ルックアップ表、BLUTなど)を含む。
Figure 0007434554000128
ここで、
Figure 0007434554000129
は、第1の輝度後方予測子によって出力された第1の予測輝度符号語/値を表す。
第1の予測輝度符号語/値と、第1の予測輝度符号語/値によって近似される入力HDR信号中の標的輝度符号語/値
Figure 0007434554000130
との間の予測誤差は、逆カスケード演算(それは、輝度固有、第1段階固有、エンコーダ固有などであってもよい)を使用して、以下のように生成され得る。
Figure 0007434554000131
予測誤差は、第2の後方予測子または予測操作におけるMMRマッピングなどの第2の輝度後方予測子を用いて予測または近似される予測標的値として、以下のように使用され得る。
Figure 0007434554000132
輝度チャネルについての最終予測値
Figure 0007434554000133
は、第1および第2の輝度後方予測子の両方によって出力された予測値を以下のように合計して生成される。
Figure 0007434554000134
同様に、後方(再成形)経路において、色度チャネルCb/C0およびCr/C1について、第1の後方予測子または予測操作は、以下のように、第1の色度後方予測子を含む。
Figure 0007434554000135
ここで、
Figure 0007434554000136
は、色度チャネルについて単一段階MMR操作に基づいた第1の予測色度値を示す。
第1の予測色度符号語/値
Figure 0007434554000137
と、第1の予測色度符号語/値によって近似される基準(または標的)HDR信号中の標的色度符号語/値
Figure 0007434554000138
との間の予測誤差は、逆カスケード演算(それは、輝度固有、第1段階固有、エンコーダ固有などであってもよい)を使用して、各色度チャネルに対して、以下のように生成され得る。
Figure 0007434554000139
予測誤差は、(使用される総段階数の種類、使用される構成概念、マッピングおよび関数の次数、操作、入力変数の総数、入力変数の種類などに関して、第1の色度後方予測子で使用されるものより)高度なMMRマッピングなどの第2の色度後方予測子を使用して、第2の後方予測子または予測操作において、以下のように予測または近似される予測標的値として使用され得る。
Figure 0007434554000140
色度チャネルについての最終的な予測値
Figure 0007434554000141
は、第1および第2の色度後方予測子の両方によって出力された予測値を、以下のように合計することによって生成される。
Figure 0007434554000142
最終的な予測輝度および色度値
Figure 0007434554000143
は、カスケード予測係数の複数の組を含む画像メタデータ(または構成メタデータ)を受信する受信デバイスによって生成されることに留意されたい。カスケード予測係数の複数の組は、第1の輝度及び色度後方予測子
Figure 0007434554000144
を規定する第1の組と、第2の輝度及び色度後方予測子
Figure 0007434554000145
を規定する第2の組を含む。これらの後方予測子は、受信デバイスによって、コーディングされたビットストリームからデコードされた(前方再成形SDR符号語/値
Figure 0007434554000146
を含む)前方再成形SDR画像に適用されて、再構成HDR画像に対する最終的な予測輝度値及び色度値
Figure 0007434554000147
を生成し得る。
SLiDMアーキテクチャ
図3Bは、例示的なSLiDMコーデック(例えば、SLiDMビデオエンコーダ、後方再成形経路を含むSLiDMビデオトランスコーダ)を示す。逆カスケード演算で結合された2段階のカスケード予測などのカスケード予測は、後方再成形経路において(例えば、追加的に、任意に、又は代替的に)実行され得る。
図に示すように、後方再成形経路におけるカスケード予測は、第1の後方予測操作(「後方予測1」と表記)と第2の後方予測操作(「後方予測2」と表記)を含む。
後方再成形経路の2段階予測には、異なるタイプのカスケード予測を用いることができる。例えば、比較的単純な予測子又は予測操作を第1段階に配置することができ、一方、異なる、比較的高度な予測子又は予測操作を、より単純な予測子又は予測操作の後の第2段階に配置して、追加の予測精度及び性能利得を得ることができる。
いくつかの操作シナリオでは、入力SDR信号中の各SDR画像の輝度及び色度符号語/値は、コーディングされたビットストリーム(例えば、図1Aの122など)中にエンコードされ、後方再成形経路への入力として提供される。
入力SDR信号中の各入力SDR画像を構成する輝度及び色度SDR符号語/値は、再構成HDR信号中の対応する再構成HDR画像を構築する再構成輝度及び色度HDR符号語/値に後方再成形することができる。再構成または後方再成形された輝度及び色度HDR符号語/値は、入力HDR信号中の対応する入力HDR画像における輝度及び色度HDR符号語/値に近似する(例えば、密接に、様々な品質レベルで、など)。入力HDR信号も再構成HDR信号もコーディングされたビットストリーム中にエンコードされない。むしろ、カスケード予測操作の複数の組などの後方再成形マッピングを規定する画像メタデータ(または構成メタデータ)が、コーディングされたビットストリーム中に含まれる。コーディングされたビットストリームからHDR画像をデコードする代わりに、受信するデコーダまたは再生デバイスは、SDR画像をデコードし、SDR画像に後方再成形マッピングを適用することによって、SDR画像から再構成HDR画像を生成する。
限定ではないが、一例として、第1の後方予測子または予測操作は、以下のように、CDFマッチング技術から構築された第1の輝度後方予測子(例えば、関数、曲線、ルックアップ表、BLUTなど)を含む。
Figure 0007434554000148
ここで、
Figure 0007434554000149
は、第1の輝度後方予測子によって出力された第1の予測輝度符号語/値を表す。
第1の予測輝度符号語/値と、第1の予測輝度符号語/値によって近似される入力HDR信号中の標的輝度符号語/値
Figure 0007434554000150
との間の予測誤差は、逆カスケード演算(それは、輝度固有、第1段階固有、エンコーダ固有などであってもよい)を使用して、以下のように生成され得る。
Figure 0007434554000151
予測誤差は、以下のように、第2の後方予測子または予測操作におけるMMRマッピングなどの第2の輝度後方予測子を用いて予測または近似される予測標的値として使用され得る。
Figure 0007434554000152
輝度チャネルの最終予測値
Figure 0007434554000153
は、第1および第2の輝度後方予測子の両方によって出力された予測値を、以下のように合計することによって生成され得る。
Figure 0007434554000154
同様に、後方(再成形)経路において、色度チャネルCb/C0およびCr/C1について、第1の後方予測子または予測操作は、以下のように、第1の色度後方予測子を含む。
Figure 0007434554000155
ここで、
Figure 0007434554000156
は、色度チャネルに対して単一段階MMR操作に基づいた第1の予測色度値を示す。
第1の予測色度符号語/値
Figure 0007434554000157
と、第1の予測色度符号語/値によって近似される基準(又は標的)HDR信号中の標的色度符号語/値
Figure 0007434554000158
との間の予測誤差は、各色度チャネルに対して、逆カスケード演算(それは、輝度固有、第1段階固有、エンコーダ固有などであってもよい)を使用して、以下のように生成され得る。
Figure 0007434554000159
予測誤差は、(使用される総段階数の種類、使用される構成概念、マッピングおよび関数の次数、操作、入力変数の総数、入力変数の種類などに関して第1の色度後方予測子で使用されるものよりも)高度なMMRマッピングなどの第2の色度後方予測子を使用して、第2の後方予測子または予測操作において、以下のように予測または近似される予測標的値として使用され得る。
Figure 0007434554000160
色度チャネルについての最終的な予測値
Figure 0007434554000161
は、第1および第2の色度後方予測子の両方によって出力された予測値を、以下のように合計することによって生成される。
Figure 0007434554000162
最終的な予測輝度および色度値
Figure 0007434554000163
は、カスケード予測係数の複数の組を含む画像メタデータ(または構成メタデータ)を受信する受信デバイスによって生成されることに留意されたい。カスケード予測係数の複数の組は、第1の輝度及び色度後方予測子
Figure 0007434554000164
を規定する第1の組と、第2の輝度及び色度後方予測子
Figure 0007434554000165
を規定する第2の組を含む。これらの後方予測子は、受信デバイスによって、コーディングされたビットストリームからデコードされた(SDR符号語/値
Figure 0007434554000166
を含む)デコードされたSDR画像に適用されて、再構成HDR画像に対する最終的な予測輝度値及び色度値
Figure 0007434554000167
を生成し得る。
像に対して適用され得る。
いくつかの操作シナリオでは、画像メタデータの時間的安定性を維持する目的で、画像メタデータの後方再成形マッピングを計算/生成/含める際に、線形セグメントベースの構造を使用することができる。例示的な線形セグメントベースの構造は、2018年1月4日に公開された米国特許出願公開第2018/0007356号に記載されており、その全体の内容は、本明細書に完全に記載されているかのように、参照により本明細書に組み込まれる。
本明細書に記載されるいくつかのまたは全ての技術は、放送ビデオアプリケーション、リアルタイムストリーミングアプリケーションなどのための適切なカラーグレードのビデオコンテンツを生成するために、リアルタイム操作の一部として実装および/または実行することができる。さらに、任意にまたは代替として、本明細書に記載されるいくつかのまたは全ての技術を、時間遅延またはオフライン操作の一部として実装および/または実行されて、非リアルタイムストリーミングアプリケーション、シネマアプリケーションなどのための適切なカラーグレードのビデオコンテンツを生成することができる。
プロセス・フローの例
図4Aは、ある実施形態による例示的なプロセス・フローを示す。いくつかの実施形態では、一つまたは複数の計算デバイスまたはコンポーネント(たとえば、エンコードデバイス/モジュール、トランスコードデバイス/モジュール、デコードデバイス/モジュール、逆トーンマッピングデバイス/モジュール、トーンマッピングデバイス/モジュール、メディアデバイス/モジュール、逆マッピング生成および適用システムなど)が、このプロセス・フローを実行してもよい。ブロック402において、画像処理システムは、第1の予測子を、第1のドメインでコーディングされた入力画像に適用し、第1のドメインとは異なる第2のドメインでコーディングされた予測標的画像の予測標的符号語に近似する第1段階の予測符号語を生成する。
ブロック404において、画像処理システムは、第2段階の予測標的値を、予測標的符号語と第1段階の予測符号語に対して逆カスケード演算を行うことによって作成する。
ブロック406において、画像処理システムは、第1のドメインでの入力画像に第2の予測子を適用し、第2段階の予測標的値に近似する第2段階の予測値を生成する。
ブロック408において、画像処理システムは、カスケード予測係数の複数の組を生成する。カスケード予測係数の該複数の組は、第1の予測子を規定するカスケード予測係数の第1の組を含む。カスケード予測係数の該複数の組は、第2の予測子を規定するカスケード予測係数の第2の異なる組を含む。
ブロック410において、画像処理システムは、カスケード予測係数の前記複数の組を、画像メタデータとしてビデオ信号内にエンコードする。ビデオ信号は、第1のドメインでの前記入力画像を以てさらにエンコードされる。ビデオ信号の受信デバイスは、前記複数の組のカスケード予測係数を使用して、第1の予測子および第2の予測子を入力画像に適用し、第2のドメインでの予測画像を生成する。第2のドメインでの予測画像は、第2のドメインでの予測標的画像に近似する。
ある実施形態では、ビデオ信号は:単一層の後方互換信号または単一層の逆ディスプレイ管理信号のうちの1つを表し;第2のドメインは:第1のドメインよりも高いダイナミックレンジ、第1のドメインと同じダイナミックレンジ、または第1のドメインよりも低いダイナミックレンジのうちの1つを有する。
ある実施形態では、第1の予測子および第2の予測子は、第1のドメインでの入力画像を第2のドメインでの予測画像にマッピングする全体的な後方再成形マッピングを表す。
ある実施形態では、第1の予測子は、第1の輝度予測子および第1の色度予測子を含み;第2の予測子は、第2の輝度予測子および第2の色度予測子を含み;第1および第2の輝度予測子は、異なるタイプの輝度予測子であり、第1および第2の色度予測子は、異なるタイプの色度予測子である。
ある実施形態では、第2の輝度予測子は、第1の輝度予測子よりも進歩している。
ある実施形態では、第1の輝度予測子は、単一チャネル多項式予測子を表し;第2の輝度予測子は、多チャネル多変量多重回帰(MMR)予測子を表す。
ある実施形態では、第2の色度予測子は、第1の色度予測子よりも進歩している。
ある実施形態では、第1の色度予測子は、一次の多変量多重回帰(MMR)予測子を表し;第2の色度予測子は、一次よりも高い二次のMMR予測子を表す。
ある実施形態では、第1のドメインでの入力画像は、第2のドメインでの予測標的画像に前方再成形マッピングを適用することによって生成される前方再成形画像である。
ある実施形態では、前方再成形マッピングは、多段階カスケード予測に基づかないマッピング、または多段階カスケード予測に基づくマッピングのうちの1つを表す。
ある実施形態では、カスケード予測は、算術加算演算、算術乗算演算、可逆算術演算、可逆関数演算、他の可逆演算などのうちの1つを表す。
図4Bは、本発明のある実施形態による例示的なプロセス・フローを示す図である。いくつかの実施形態では、一つまたは複数の計算デバイスまたはコンポーネント(たとえば、エンコードデバイス/モジュール、トランスコードデバイス/モジュール、デコードデバイス/モジュール、逆トーンマッピングデバイス/モジュール、トーンマッピングデバイス/モジュール、メディアデバイス/モジュール、予測モデルおよび特徴選択システム、逆マッピング生成および適用システムなど)がこのプロセス・フローを実行してもよい。452では、ビデオデコードシステムが、ビデオ信号から、第1のドメインでコーディングされた入力画像をデコードする。
454では、ビデオデコードシステムは、ビデオ信号から、カスケード予測係数の複数の組を含む画像メタデータをデコードする。
カスケード予測係数の複数の組は、上流の画像処理デバイスによって生成されたものである。
カスケード予測係数の複数の組は、第2のドメインでコーディングされた予測標的画像に少なくとも部分的に基づいて生成され、第1の予測子を規定する、カスケード予測係数の第1の組を含む。第1のドメインは、第2のドメインとは異なる。
カスケード予測係数の複数の組は、第2のドメインでの予測標的画像に少なくとも部分的に基づいて生成され、第2の予測子を規定する、カスケード予測係数の第2の組を含む。
456では、ビデオでコードシステムは、カスケード動作によって組み合わされた第1の予測子および第2の予測子を、第1のドメインでの入力画像に適用して、第2のドメインでの再構成画像を生成する。第2のドメインでの再構成画像は、第2のドメインでの予測標的画像に近似する。
458では、ビデオデコードシステムは、第2のドメインでの再構成画像から導出された表示画像を、表示デバイスを用いて描画させる。
ある実施形態では、表示デバイス、モバイル装置、セットトップボックス、マルチメディア装置などの計算デバイスが、前述の方法のいずれかを実行するように構成される。ある実施形態では、装置は、プロセッサを備え、前述の方法のいずれかを実行するように構成される。ある実施形態では、ソフトウェア命令を記憶する非一時的なコンピュータ読み取り可能な記憶媒体であって、該命令は、一つまたは複数のプロセッサによって実行されると、前述の方法のいずれかの実行を引き起こす。
ある実施形態では、一つまたは複数のプロセッサと、該一つまたは複数のプロセッサによって実行されたときに前述の方法のいずれかの実行を引き起こす命令の組を記憶している一つまたは複数の記憶媒体とを備える計算装置。
別個の諸実施形態が本明細書で議論されるが、本明細書で議論される実施形態および/または部分的実施形態の任意の組み合わせが、さらなる実施形態を形成するために組み合わされ得ることに留意されたい。
コンピュータ・システム実装の例
本発明の実施形態は、コンピュータ・システム、電子回路およびコンポーネントにおいて構成されるシステム、集積回路(IC)デバイス、たとえばマイクロコントローラ、フィールド・プログラマブル・ゲート・アレイ(FPGA)、または他の構成可能またはプログラマブル・ロジック・デバイス(PLD)、離散時間またはデジタル信号プロセッサ(DSP)、特定用途向けIC(ASIC)、および/またはこれらのシステム、デバイスまたはコンポーネントの一つまたは複数を含む装置を用いて実装されうる。コンピュータおよび/またはICは、本明細書に記載されるような、拡張されたダイナミックレンジを有する画像の適応的な知覚量子化に関する命令を実行、制御、または執行することができる。コンピュータおよび/またはICは、本明細書に記載される適応的な知覚量子化プロセスに関連するさまざまなパラメータまたは値のいずれかを計算することができる。画像およびビデオの実施形態は、ハードウェア、ソフトウェア、ファームウェア、およびそれらのさまざまな組み合わせで実装することができる。
本発明のある種の実装は、プロセッサに本開示の方法を実行させるソフトウェア命令を実行するコンピュータプロセッサを含む。たとえば、ディスプレイ、エンコーダ、セットトップボックス、トランスコーダ等における一つまたは複数のプロセッサは、プロセッサにとってアクセス可能なプログラムメモリ内のソフトウェア命令を実行することによって、上述したようなHDR画像の適応的な知覚量子化に関連する方法を実装することができる。本発明の実施形態はまた、プログラム・プロダクトの形で提供されてもよい。プログラム・プロダクトは、データ・プロセッサによって実行されると、データ・プロセッサに本発明の実施形態の方法を実行させる命令を含む一組のコンピュータ読み取り可能な信号を担持する任意の非一時的媒体を含んでいてもよい。本発明の実施形態によるプログラム・プロダクトは、多種多様な形のいずれであってもよい。プログラム・プロダクトは、たとえば、フロッピーディスケット、ハードディスクドライブを含む磁気データ記憶媒体、CD-ROM、DVDを含む光データ記憶媒体、ROM、フラッシュRAMを含む電子的データ記憶媒体等の物理媒体を含むことができる。プログラム・プロダクト上のコンピュータ読み取り可能な信号は、任意的に圧縮または暗号化されてもよい。
コンポーネント(たとえば、ソフトウェアモジュール、プロセッサ、アセンブリ、デバイス、回路等)が上記で言及されている場合、別段の指示がない限り、当該コンポーネントへの言及(「手段」への言及を含む)は、本発明の示されている例示的実施形態において機能を実行する開示された構造と構造的に等価でないコンポーネントを含む、記載されたコンポーネントの機能を実行する(たとえば、機能的に同等である)任意のコンポーネントを、その当該コンポーネントの等価物として含むものとして解釈されるべきである。
ある実施形態によれば、本明細書に記載される技術は、一つまたは複数の特殊目的の計算デバイスによって実装される。特殊目的の計算デバイスは、技術を実行するために固定結線にされてもよく、または技術を実行するために永続的にプログラムされた一つまたは複数の特定用途向け集積回路(ASIC)またはフィールド・プログラマブル・ゲート・アレイ(FPGA)のようなデジタル電子装置を含んでいてもよく、またはファームウェア、メモリ、他の記憶装置、または組み合わせのプログラム命令に従って技術を実行するためにプログラムされた一つまたは複数の汎用ハードウェア・プロセッサを含んでいてもよい。そのような特殊目的の計算デバイスは、カスタムの固定結線ロジック、ASIC、またはFPGAに本技法を達成するカスタムプログラミングをもたせたものと組み合わせてもよい。特殊目的の計算デバイスは、デスクトップ・コンピュータ・システム、ポータブル・コンピュータ・システム、ハンドヘルド・デバイス、ネットワーキング・デバイス、またはこの技術を実施するために固定結線のおよび/またはプログラムのロジックを組み込んだ他の任意の装置であってもよい。
たとえば、図5は、本発明のある実施形態が実装されうるコンピュータ・システム500を示すブロック図である。コンピュータ・システム500は、情報を通信するためのバス502または他の通信機構と、情報を処理するための、バス502と結合されたハードウェア・プロセッサ504とを含む。ハードウェア・プロセッサ504は、たとえば、汎用マイクロプロセッサであってもよい。
コンピュータ・システム500はまた、プロセッサ504によって実行される情報および命令を記憶するためにバス502に結合された、ランダム・アクセス・メモリ(RAM)または他の動的記憶装置のようなメイン・メモリ506を含む。メイン・メモリ506はまた、プロセッサ504によって実行される命令の実行中に、一時変数または他の中間情報を記憶するために使用されてもよい。そのような命令は、プロセッサ504にとってアクセス可能な非一時的な記憶媒体に記憶されると、コンピュータ・システム500を、該命令において指定された動作を実行するようにカスタマイズされた専用マシンにする。
コンピュータ・システム500は、さらに、プロセッサ504のための静的情報および命令を記憶するための、バス502に結合された読み出し専用メモリ(ROM)508または他の静的記憶装置を含む。情報および命令を記憶するために、磁気ディスクまたは光ディスクなどの記憶装置510が設けられ、バス502に結合される。
コンピュータ・システム500は、バス502を介して、コンピュータユーザに情報を表示するための液晶ディスプレイのようなディスプレイ512に結合されうる。入力装置514は、英数字および他のキーを含み、情報およびコマンド選択をプロセッサ504に通信するためにバス502に結合される。別のタイプのユーザ入力装置は、方向情報およびコマンド選択をプロセッサ504に通信し、ディスプレイ512上のカーソルの動きを制御するための、マウス、トラックボール、またはカーソル方向キーなどのカーソル制御装置516である。この入力装置は、典型的には、第1の軸(たとえば、x)および第2の軸(たとえば、y)の2つの軸における2つの自由度を有し、装置が平面内の位置を指定することを許容する。
コンピュータ・システム500は、カスタマイズされた固定結線ロジック、一つまたは複数のASICまたはFPGA、ファームウェア、および/またはプログラム・ロジックを使用して、本明細書に記載の技術を実装することができ、これらは、コンピュータ・システムと組み合わさって、コンピュータ・システム500を特殊目的の機械にするか、またはプログラムする。ある実施形態によれば、本明細書に記載される技術は、プロセッサ504がメイン・メモリ506に含まれる一つまたは複数の命令の一つまたは複数のシーケンスを実行することに応答して、コンピュータ・システム500によって実行される。そのような命令は、記憶装置510のような別の記憶媒体からメイン・メモリ506に読み込まれてもよい。メイン・メモリ506に含まれる命令のシーケンスの実行により、プロセッサ504は、本明細書に記載のプロセスステップを実行する。代替的な実施形態では、固定結線回路が、ソフトウェア命令の代わりに、またはソフトウェア命令と組み合わせて使用されてもよい。
本明細書で使用される用語「記憶媒体」は、機械を特定の仕方で動作させるデータおよび/または命令を記憶する任意の非一時的な媒体を指す。そのような記憶媒体は、不揮発性媒体および/または揮発性媒体を含んでいてもよい。不揮発性媒体は、たとえば、記憶装置510のような光ディスクまたは磁気ディスクを含む。揮発性媒体は、メイン・メモリ506のようなダイナミック・メモリを含む。記憶媒体の一般的な形態は、たとえば、フロッピーディスク、フレキシブルディスク、ハードディスク、ソリッドステートドライブ、磁気テープ、または他の任意の磁気データ記憶媒体、CD-ROM、他の任意の光学式データ記憶媒体、穴のパターンを有する任意の物理的媒体、RAM、PROM、およびEPROM、FLASH-EPROM、NVRAM、他の任意のメモリチップまたはカートリッジを含む。
記憶媒体は、伝送媒体とは区別されるが、伝送媒体との関連で使用することができる。伝送媒体は、記憶媒体間の情報の転送に参加する。たとえば、伝送媒体は、バス502を構成するワイヤを含む、同軸ケーブル、銅線および光ファイバーを含む。伝送媒体は、また、電波および赤外線データ通信の間に生成されるような光波または音響波の形をとることができる。
一つまたは複数の命令の一つまたは複数のシーケンスを実行のためにプロセッサ504に搬送することには、さまざまな形の媒体が関与し得る。たとえば、命令は、最初、遠隔コンピュータの磁気ディスクまたはソリッドステートドライブ上で担持されてもよい。遠隔コンピュータは、命令をそのダイナミック・メモリにロードし、モデムを使用して電話回線を介して命令を送信することができる。コンピュータ・システム500にローカルなモデムは、電話線上でデータを受信し、赤外線送信機を使用して、該データを赤外線信号に変換することができる。赤外線検出器は、赤外線信号内で搬送されるデータを受信することができ、適切な回路が該データをバス502上に載せることができる。バス502はデータをメイン・メモリ506に搬送し、そこからプロセッサ504が命令を取り出して実行する。メイン・メモリ506によって受信された命令は、任意的に、プロセッサ504による実行の前または後のいずれかで、記憶装置510上に記憶されうる。
コンピュータ・システム500はまた、バス502に結合された通信インターフェース518を含む。通信インターフェース518は、ローカル・ネットワーク522に接続されたネットワーク・リンク520への双方向データ通信結合を提供する。たとえば、通信インターフェース518は、統合サービス・デジタル・ネットワーク(ISDN)・カード、ケーブル・モデム、衛星モデム、または対応するタイプの電話回線にデータ通信接続を提供するモデムであってもよい。別の例として、通信インターフェース518は、データ通信接続を互換性のあるLANに提供するためのローカルエリアネットワーク(LAN)カードであってもよい。また、無線リンクが実装されてもよい。いずれかのそのような実装では、通信インターフェース518は、種々のタイプの情報を表すデジタル・データ・ストリームを搬送する電気信号、電磁信号、または光信号を送受信する。
ネットワーク・リンク520は、典型的には、一つまたは複数のネットワークを通じて他のデータ装置へのデータ通信を提供する。たとえば、ネットワーク・リンク520は、ローカル・ネットワーク522を通じて、ホスト・コンピュータ524への、またはインターネット・サービス・プロバイダー(ISP)526によって運営されるデータ設備への接続を提供することができる。ISP 526は、現在一般に「インターネット」528と呼ばれている世界規模のパケットデータ通信ネットワークを介してデータ通信サービスを提供する。ローカル・ネットワーク522およびインターネット528は両方とも、デジタル・データ・ストリームを搬送する電気信号、電磁信号または光信号を使用する。コンピュータ・システム500との間でデジタル・データを搬送する、種々のネットワークを介する信号およびネットワーク・リンク520上および通信インターフェース518を介する信号は、伝送媒体の例示的な形態である。
コンピュータ・システム500は、ネットワーク、ネットワーク・リンク520および通信インターフェース518を介して、メッセージを送信し、プログラム・コードを含むデータを受信することができる。インターネットの例では、サーバー530は、インターネット528、ISP 526、ローカル・ネットワーク522、および通信インターフェース518を介して、アプリケーション・プログラムのための要求されたコードを送信することができる。
受信されたコードは、それが受信されたときにプロセッサ504によって実行され、および/または後の実行のために記憶装置510、または他の不揮発性記憶装置に記憶される。
同等物、拡張、代替およびその他
上記の明細書では、本発明の実施形態が、実装ごとに異なる可能性のある多数の具体的詳細を参照して、説明されてきた。よって、何が本発明の特許請求される実施形態であり、出願人によって本発明の特許請求される実施形態であると意図されているかの唯一かつ排他的な指標は、任意のその後の訂正も含めて、請求項が特許される特定の形での、この出願に対して発行される請求項のセットである。そのような請求項に含まれる用語について本明細書に明示的に記載される定義は、当該請求項において使用される用語の意味を支配するものとする。よって、請求項に明示的に記載されていない限定、要素、特性、特徴、利点または属性は、そのような請求項の範囲をいかなる仕方であれ限定すべきではない。よって、本明細書および図面は、制約する意味ではなく例示的な意味に考えられるべきである。

Claims (14)

  1. 第1の予測子を、第1のドメインでコーディングされた入力画像に適用し、第1のドメインとは異なる第2のドメインでコーディングされた予測標的画像の予測標的符号語に近似する第1段階の予測符号語を生成するステップと;
    第2段階の予測標的値を、前記予測標的符号語と前記第1段階の予測符号語に対して逆カスケード演算を行うことによって作成するステップと;
    第1のドメインでの前記入力画像に第2の予測子を適用し、前記第2段階の予測標的値に近似する第2段階の予測値を生成するステップと;
    カスケード予測係数の複数の組を生成するステップであって、カスケード予測係数の該複数の組は、前記第1の予測子を規定するカスケード予測係数の第1の組を含み、カスケード予測係数の該複数の組は、前記第2の予測子を規定するカスケード予測係数の第2の異なる組を含む、ステップと;
    カスケード予測係数の前記複数の組を、画像メタデータとしてビデオ信号内にエンコードするステップであって、前記ビデオ信号は、第1のドメインでの前記入力画像を以てさらにエンコードされ、前記ビデオ信号の受信デバイスは、前記第1の組のカスケード予測係数を使用して前記第1の予測子を前記入力画像に適用し、前記第2の組のカスケード予測係数を使用して前記第2の予測子を前記入力画像に適用し、カスケード演算を使用して前記第1の予測子および前記第2の予測子の出力を組み合わせて、第2のドメインでの予測画像を生成し、第2のドメインでの前記予測画像は、第2のドメインでの前記予測標的画像に近似する、ステップとを含
    前記逆カスケード演算は前記カスケード演算の共役である、
    方法。
  2. 前記ビデオ信号は:単一層の後方互換信号または単一層の逆ディスプレイ管理信号のうちの1つを表し;第2のドメインは:第1のドメインよりも高いダイナミックレンジ、第1のドメインと同じダイナミックレンジ、または第1のドメインよりも低いダイナミックレンジのうちの1つを有する、請求項1に記載の方法。
  3. 前記第1の予測子および前記第2の予測子は、第1のドメインでの前記入力画像を第2のドメインでの前記予測画像にマッピングする全体的な後方再成形マッピングを表す、請求項1または2に記載の方法。
  4. 前記第1の予測子は、第1の輝度予測子および第1の色度予測子を含み、前記第2の予測子は、第2の輝度予測子および第2の色度予測子を含み、前記第1および第2の輝度予測子は、異なるタイプの輝度予測子であり、前記第1および第2の色度予測子は、異なるタイプの色度予測子である、請求項1ないし3のうちいずれか一項に記載の方法。
  5. 前記第1の輝度予測子は、単一チャネル多項式予測子を表し;前記第2の輝度予測子は、多チャネル多変量多重回帰(MMR)予測子を表す、請求項4に記載の方法。
  6. 前記第1の色度予測子は、二次の多変量多重回帰(MMR)予測子を表し;前記第2の色度予測子は、一次よりも高い三次のMMR予測子を表す、請求項4ないしのうちいずれか一項に記載の方法。
  7. 第1のドメインでの前記入力画像は、第2のドメインでの前記予測標的画像に前方再成形マッピングを適用することによって生成される前方再成形画像である、請求項1ないしのうちいずれか一項に記載の方法。
  8. 前記前方再成形マッピングは、多段階カスケード予測に基づかないマッピング、または多段階カスケード予測に基づくマッピングのうちの1つを表し、前記多段階カスケード予測は、カスケード演算子によって組み合わされる2つ以上の予測子を使用する予測である、請求項に記載の方法。
  9. 前記カスケード演算は、算術加算演算、算術乗算演算、可逆算術演算、可逆関数演算、または他の可逆演算のうちの1つを表す、請求項1ないしのうちいずれか一項に記載の方法。
  10. ビデオ信号から、第1のドメインでコーディングされた入力画像をデコードするステップと;
    前記ビデオ信号から、カスケード予測係数の複数の組を含む画像メタデータをデコードするステップであって;
    カスケード予測係数の前記複数の組は、上流の画像処理デバイスによって生成されたものであり;
    カスケード予測係数の前記複数の組は、第2のドメインでコーディングされた予測標的画像に少なくとも部分的に基づいて生成され、第1の予測子を規定する、カスケード予測係数の第1の組を含み、第1のドメインは、第2のドメインとは異なり;
    カスケード予測係数の前記複数の組は、第2のドメインでの予測標的画像に少なくとも部分的に基づいて生成され、第2の予測子を規定する、カスケード予測係数の第2の組を含む、ステップと;
    前記第1の予測子および前記第2の予測子を、第1のドメインでの前記入力画像に適用して、第2のドメインでの再構成画像を生成するステップであって、第2のドメインでの前記再構成画像は、第2のドメインでの前記予測標的画像に近似し、カスケード演算が、前記入力画像に前記第1の予測子を適用することから生成される第1段階の予測符号語を、前記入力画像に前記第2の予測子を適用することから生成される第2段階の予測値と組み合わせる、ステップと;
    第2のドメインでの前記再構成画像から導出された表示画像を、表示デバイスを用いて描画させるステップとを含む、
    方法。
  11. 前記第1の予測子および前記第2の予測子は、第1のドメインでの前記入力画像を第2のドメインでの前記再構成画像にマッピングする全体的な後方再成形マッピングを表す、請求項10に記載の方法。
  12. 前記表示画像は、第3のドメインでコーディングされた第2の再構成画像から直接導出され、第3のドメインでの前記第2の再構成画像は、第3のドメインでの第2の予測標的画像に近似し、第3のドメインでの前記第2の再構成画像は部分的には、前記入力画像に第3の予測子を適用することから生成される第3段階の予測値を、第2のドメインでの前記再構成画像における再構成符号語と組み合わせる第2のカスケード演算を使って生成される、請求項10または11に記載の方法。
  13. 請求項1ないし12のうちいずれか一項に記載の方法を実行するように構成された、プロセッサを有する装置。
  14. 請求項1ないし12のうちいずれか一項に記載の方法に従って、一つまたは複数のプロセッサで方法を実行するためのコンピュータ実行可能命令を記憶している、非一時的なコンピュータ読み取り可能な記憶媒体。
JP2022533503A 2019-12-06 2020-12-03 カスケード予測 Active JP7434554B2 (ja)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201962944636P 2019-12-06 2019-12-06
EP19214124.0 2019-12-06
US62/944,636 2019-12-06
EP19214124 2019-12-06
PCT/US2020/063165 WO2021113549A1 (en) 2019-12-06 2020-12-03 Cascade prediction

Publications (2)

Publication Number Publication Date
JP2023504837A JP2023504837A (ja) 2023-02-07
JP7434554B2 true JP7434554B2 (ja) 2024-02-20

Family

ID=74068686

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2022533503A Active JP7434554B2 (ja) 2019-12-06 2020-12-03 カスケード予測

Country Status (5)

Country Link
US (1) US11838531B2 (ja)
EP (1) EP4070541A1 (ja)
JP (1) JP7434554B2 (ja)
CN (1) CN114830640A (ja)
WO (1) WO2021113549A1 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU2022344154A1 (en) 2021-09-09 2024-03-28 Dolby Laboratories Licensing Corporation Tensor-product b-spline prediction for hdr video in mobile applications

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009524371A (ja) 2006-01-23 2009-06-25 マックス−プランク−ゲゼルシャフト・ツア・フェルデルング・デア・ヴィッセンシャフテン・エー・ファオ 高ダイナミックレンジコーデック
WO2017019818A1 (en) 2015-07-28 2017-02-02 Vid Scale, Inc. High dynamic range video coding architectures with multiple operating modes
WO2017024042A2 (en) 2015-08-04 2017-02-09 Dolby Laboratories Licensing Corporation Signal reshaping for high dynamic range signals
US20180098094A1 (en) 2016-10-05 2018-04-05 Dolby Laboratories Licensing Corporation Inverse luma/chroma mappings with histogram transfer and approximation

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4003128B2 (ja) * 2002-12-24 2007-11-07 ソニー株式会社 画像データ処理装置および方法、記録媒体、並びにプログラム
JPWO2008132890A1 (ja) * 2007-04-16 2010-07-22 株式会社東芝 画像符号化と画像復号化の方法及び装置
CN101159875B (zh) 2007-10-15 2011-10-05 浙江大学 二重预测视频编解码方法和装置
WO2012142471A1 (en) 2011-04-14 2012-10-18 Dolby Laboratories Licensing Corporation Multiple color channel multiple regression predictor
US9396523B2 (en) * 2013-07-24 2016-07-19 Microsoft Technology Licensing, Llc Image restoration cascade
US10123019B2 (en) * 2014-02-13 2018-11-06 Dolby Laboratories Licensing Corporation Piecewise inter-layer prediction for signals with enhanced dynamic range
US10136147B2 (en) * 2014-06-11 2018-11-20 Dolby Laboratories Licensing Corporation Efficient transcoding for backward-compatible wide dynamic range codec
EP3272123B1 (en) 2015-03-20 2019-06-19 Dolby Laboratories Licensing Corporation Signal reshaping approximation
CN108352166B (zh) * 2015-09-25 2022-10-28 弗劳恩霍夫应用研究促进协会 使用线性预测编码对音频信号进行编码的编码器和方法
DE202015106864U1 (de) 2015-12-16 2017-03-17 Eto Magnetic Gmbh Elektromagnetische Ventilvorrichtung und Verwendung einer solchen
WO2017121549A1 (en) 2016-01-12 2017-07-20 Telefonaktiebolaget Lm Ericsson (Publ) Frequency based prediction
US10701375B2 (en) * 2016-03-23 2020-06-30 Dolby Laboratories Licensing Corporation Encoding and decoding reversible production-quality single-layer video signals
GB201611253D0 (en) 2016-06-29 2016-08-10 Dolby Laboratories Licensing Corp Efficient Histogram-based luma look matching
TWI812874B (zh) 2019-10-01 2023-08-21 美商杜拜研究特許公司 張量乘積之b平滑曲線預測子

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009524371A (ja) 2006-01-23 2009-06-25 マックス−プランク−ゲゼルシャフト・ツア・フェルデルング・デア・ヴィッセンシャフテン・エー・ファオ 高ダイナミックレンジコーデック
WO2017019818A1 (en) 2015-07-28 2017-02-02 Vid Scale, Inc. High dynamic range video coding architectures with multiple operating modes
WO2017024042A2 (en) 2015-08-04 2017-02-09 Dolby Laboratories Licensing Corporation Signal reshaping for high dynamic range signals
US20180098094A1 (en) 2016-10-05 2018-04-05 Dolby Laboratories Licensing Corporation Inverse luma/chroma mappings with histogram transfer and approximation

Also Published As

Publication number Publication date
JP2023504837A (ja) 2023-02-07
EP4070541A1 (en) 2022-10-12
US20230007294A1 (en) 2023-01-05
US11838531B2 (en) 2023-12-05
WO2021113549A1 (en) 2021-06-10
CN114830640A (zh) 2022-07-29

Similar Documents

Publication Publication Date Title
CN109416832B (zh) 高效的基于直方图的亮度外观匹配
US10264287B2 (en) Inverse luma/chroma mappings with histogram transfer and approximation
CN108885783B (zh) 编码和解码可逆制作质量单层视频信号
US10244244B2 (en) Screen-adaptive decoding of high dynamic range video
KR102380164B1 (ko) 게이밍 및/또는 sdr+ 콘텐츠에 대한 자동 디스플레이 관리 메타데이터 생성
US10609424B2 (en) Single-layer progressive coding for supporting multi-capability HDR composition
JP7386977B2 (ja) テンソル積bスプライン予測子
EP3306563B1 (en) Inverse luma/chroma mappings with histogram transfer and approximation
CN113170205B (zh) 整形函数生成方法及装置以及图像解码方法及装置
JP7443546B2 (ja) 画像処理方法、システム及びコンピュータ・プログラム
JP7439251B2 (ja) ビデオコーデックにおける品質と計算の複雑さとの間の調整可能なトレードオフ
JP7434554B2 (ja) カスケード予測
JP7543577B2 (ja) チェーンドリシェーピング関数の最適化
CN117426091B (zh) 用于生成或渲染图像的方法以及计算装置
US20230368344A1 (en) Color transformation for hdr video with a coding-efficiency constraint
US20240095893A1 (en) Image enhancement via global and local reshaping

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20221006

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20230912

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20231211

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20240109

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20240207

R150 Certificate of patent or registration of utility model

Ref document number: 7434554

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150