JP2023501885A - ビデオコーデックにおける品質と計算の複雑さとの間の調整可能なトレードオフ - Google Patents

ビデオコーデックにおける品質と計算の複雑さとの間の調整可能なトレードオフ Download PDF

Info

Publication number
JP2023501885A
JP2023501885A JP2022522878A JP2022522878A JP2023501885A JP 2023501885 A JP2023501885 A JP 2023501885A JP 2022522878 A JP2022522878 A JP 2022522878A JP 2022522878 A JP2022522878 A JP 2022522878A JP 2023501885 A JP2023501885 A JP 2023501885A
Authority
JP
Japan
Prior art keywords
image
mapping
backward
luminance
dynamic range
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2022522878A
Other languages
English (en)
Other versions
JP7439251B2 (ja
Inventor
ソーン,チーン
ラージ,アルン
スゥ,グワン-ミーン
Original Assignee
ドルビー ラボラトリーズ ライセンシング コーポレイション
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ドルビー ラボラトリーズ ライセンシング コーポレイション filed Critical ドルビー ラボラトリーズ ライセンシング コーポレイション
Publication of JP2023501885A publication Critical patent/JP2023501885A/ja
Application granted granted Critical
Publication of JP7439251B2 publication Critical patent/JP7439251B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/85Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression
    • H04N19/86Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression involving reduction of coding artifacts, e.g. of blockiness
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/186Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a colour or a chrominance component
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/132Sampling, masking or truncation of coding units, e.g. adaptive resampling, frame skipping, frame interpolation or high-frequency transform coefficient masking
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/85Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/98Adaptive-dynamic-range coding [ADRC]

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

【要約】後方再整形マッピングテーブルは、前方再整形マッピングテーブルの逆として初めに生成される。後方再整形マッピングテーブルは、コンテンツマッピングされた輝度コードワードを、サンプリングされた輝度コードワードに輝度前方マッピングを適用することによって生成された前方再整形輝度コードワードで置き換えることによって更新される。輝度前方マッピングは、前方再整形マッピングテーブルから構築される。後方再整形マッピングテーブルおよび輝度前方マッピングを用いて、前方再整形画像から再構成画像を創るための後方再整形マッピングを生成する。前方再整形画像は、後方再整形マッピングを指定する画像メタデータと共に、ビデオ信号内にエンコードされる。ビデオ信号の受信デバイスは、後方再整形マッピングを前方再整形画像に適用して、第2のダイナミックレンジの再構成画像を創る。

Description

関連出願の相互参照
本出願は、2019年10月17日に出願された米国仮特許出願第62/916,579号、および2019年10月17日に出願された欧州特許出願第19203773.7号の優先権を主張するものであり、各出願は、その全体が参照により本明細書に組み込まれる。
技術
本開示は、概して画像に関する。より詳細には、本開示の一実施形態は、ビデオコーデックにおける品質と計算の複雑さとの間の調整可能なトレードオフに関する。
本明細書で使用する場合、用語「ダイナミックレンジ」(DR)は、例えば、最も暗い黒(ダーク)から最も明るい白(ハイライト)までの、画像での強度(例えば、輝度、ルマ)の範囲を知覚する人間の視覚システム(HVS)の能力に関連してもよい。この意味で、DRは「シーン基準」強度に関する。また、DRは、特定の幅の強度範囲を十分にまたは近似的にレンダリングするディスプレイデバイスの能力にも関連し得る。この意味で、DRは「ディスプレイ基準」強度に関する。本明細書の記載のいずれかの時点において、特定の意味が特定の意義を有するように明示的に規定されていない限り、この用語は、いずれの意味においても、例えば、互換的に使用され得ると推測されるべきである。
本明細書で使用する場合、用語「高ダイナミックレンジ(HDR)」は、人間の視覚システム(HVS)のおよそ14~15桁以上の大きさに及ぶDR幅に関連する。実際には、人間が同時に強度範囲中の広い範囲を知覚できるDRは、HDRとの関係でいくぶん切り捨てられる可能性がある。本明細書で使用する場合、強化ダイナミックレンジ(EDR)または視覚ダイナミックレンジ(VDR)という用語は、シーンまたは画像を横切る光順応変化を許容して、目の動きを含む人間の視覚システム(HVS)によってシーンまたは画像内で知覚可能なDRに個別にまたは交換可能に関連することができる。本明細書中で使用される場合、EDRは、5~6桁の大きさのDRに関することができる。したがって、EDRは、真のシーン基準HDRとの関連ではおそらく多少狭いが、EDRは、それにもかかわらず、広いDR幅を表し、HDRと呼んでもよい。
実際には、画像は、色空間の1つ以上の色成分(例えば、輝度Yおよび色度CbおよびCr)を含み、各色成分は、画素当たりnビットの精度(例えば、n=8)によって表される。非線形輝度コーディング(例えば、ガンマエンコーディング)を用いて、n≦8の画像(例えば、カラー24ビットJPEG画像)を標準ダイナミックレンジの画像とみなし、n>8の画像を強化ダイナミックレンジの画像とみなすことができる。
所与のディスプレイのための基準電気光学伝達関数(EOTF)は、入力ビデオ信号のカラー値(例えば、輝度)とディスプレイによって生成されたスクリーンのカラー値(例えば、スクリーン輝度)との間の関係を特徴付ける。例えば、ITU Rec. ITU-R BT. 1886 「Reference electro-optical transfer function for flat panel displays used in HDTV studio production」(2011年3月)は、その全体が参照により本明細書に組み込まれているが、それはフラットパネルディスプレイのための基準EOTFを定義する。ビデオストリームが与えられた場合、そのEOTFに関する情報は(画像)メタデータとしてビットストリームに埋め込まれる可能性がある。本明細書での用語「メタデータ」は、コーディングされたビットストリームの一部として送信される任意の補助情報に関し、デコーダがデコードされた画像を描画するのを支援する。そのようなメタデータは、本明細書に記載されるように、色空間または色域情報、参照表示パラメータ、および補助信号パラメータを含み得るが、これらに限定されない。
本明細書で使用される用語「PQ」は、知覚的輝度振幅量子化を指す。人間の視覚系は、光レベルの増加に非常に非線形的に応答する。刺激を見る人間の能力は、その刺激の輝度、刺激の大きさ、刺激を構成する空間周波数、および刺激を見るときに眼が適応した輝度レベルによって影響される。いくつかの実施形態では、知覚量子化関数は、線形入力グレーレベルを、人間の視覚システムにおけるコントラスト感度しきい値により良くマッチングする出力グレーレベルにマッピングする。例示的なPQマッピング関数は、SMPTE ST 2084:2014「High Dynamic Range EOTF of Mastering Reference Displays」(以下、「SMPTE」)に記載されており、その全体が参照により本明細書に組み込まれ、ここで、一定の刺激サイズが与えられると、各輝度レベル(例えば、刺激レベルなど)について、その輝度レベルでの最小可視コントラストステップは、最も感度の高い順応レベルおよび最も感度の高い空間周波数に従って(HVSモデルに従って)選択される。
200~1,000cd/mまたはニトの輝度をサポートするディスプレイは、より低いダイナミックレンジ(LDR)を典型的に示しEDR (またはHDR)に関連して、標準ダイナミックレンジ(SDR)とも呼ばれる。EDRの内容は、より高いダイナミックレンジ(例えば、1000から5000ニト以上)をサポートするEDRディスプレイに表示することができる。そのようなディスプレイは、高輝度能力(例えば、0~10,000ニト以上)をサポートする代替EOTFを使用して定義され得る。そのようなEOTFの例は、SMPTE 2084およびRec. ITU-R BT.2100「Image parameter values for high dynamic range television for use in production and international programme exchange」(2017年6月)において定義される。ここでの発明者らによって高評価されるように、広範なSDRおよびHDR表示デバイスの表示能力をサポートするために使用することができるビデオコンテンツデータを構成するための改良された技術が望まれている。
本セクションに記載されているアプローチは、追求でき得たアプローチであるが、必ずしも以前に考案または追求されたアプローチではない。したがって、別段の記載がない限り、本セクションに記載されているいずれのアプローチも、単に本セクションに含まれているという理由のみで先行技術であると仮定するべきではない。同様に、特に断らない限り、1つ以上のアプローチに関して特定された問題点は、本セクションに基づいていかなる先行技術においても認識されていたと仮定すべきではない。
本発明の一実施形態が、添付の図面において、限定としてではなく例示として説明される。図面においては、同様の参照番号は同様の要素を指す。
ビデオ配信パイプラインの例示的プロセスを示す。 再構成画像の品質と、再構成画像を作成するための生成マッピングの計算上の複雑さとの間のトレードオフの例を示す。 例示的なコーデックを示す。 例示的なコーデックを示す。 例示的なコーデックを示す。 予測誤差の例を示す。 異なるカラーグレードを生成するための画像処理操作のセットの例を示す。 異なるカラーグレードに適用可能な色補正の例を示す。 マッピングテーブル更新操作と関連して実行される色補正の例を示す。 輝度更新、バックアップルックアップテーブル修正、および色補正を伴う後方再整形マッピング生成の例を示す。 例示的なプロセスフローを示す。 例示的なプロセスフローを示す。 例示的なプロセスフローを示す。 本明細書に記載されるコンピュータまたはコンピュータデバイスが実装され得る例示的なハードウェアプラットフォームの簡略化されたブロック図を示す。
実施例の説明
以下の説明において、説明の目的で、本開示の完全な理解を提供するために、多数の具体的な詳細が記載される。しかしながら、本開示は、これらの具体的な詳細なしに実施することができることは明らかであろう。他の例では、本開示を不必要に閉塞、不明瞭化、または不明確化することを避けるために、周知の構造およびデバイスは、徹底的に詳細には記載されていない。
比較的狭いダイナミックレンジのベースレイヤ(BL)画像データ(例えば、比較的低いビット深度、8ビット、10ビットなど)は、BL画像データからHDR画像データを生成/再構成するために使用される画像メタデータと共に、コーディングされたビットストリーム中にエンコードしてもよい。BL画像データ及び画像メタデータは、受信するデコード及び再生デバイスに提供することができ、比較的低いダイナミックレンジのディスプレイ(例えば、SDRディスプレイ等)上でデコードした後にBL画像データ(例えば、SDR画像データ等)を直接レンダリングすることができるか、あるいはデコードしたBL画像データ及び画像メタデータからHDR画像データを再構成し、比較的高いダイナミックレンジのディスプレイ(例えば、HDRディスプレイ等)上でHDR画像データをレンダリングすることができる。
一例(例えば、高忠実度等)のアプローチでは、再構成されたHDR画像データの品質は、計算コストおよびビデオ配信遅延を著しく増加させることを犠牲にして最大化され得る。別の例(例えば、高効率等)のアプローチでは、HDR画像データを再構成するために使用される画像メタデータを生成するための計算コストは、再構成されたHDR画像データの品質を著しく低下させることを犠牲にして最小化され得る。再構成されたHDR画像のレンダリングのデコーダ側品質およびエンコーダ側計算コスト(または効率)の点で、高忠実度アプローチと高効率アプローチの間には比較的大きなギャップが存在する。例示的な高忠実度および高効率画像メタデータ生成は、2019年5月9日に出願されたPCT特許出願第PCT/US2019/031620号に記載されており、その内容全体は、本明細書に完全に記載されているかのように、参照により本明細書に組み込まれる。
種々のコーデック及び媒体処理システムの能力をより良く活用し、また、最大限実現可能な品質で種々の媒体消費アプリケーションをタイムリーにサポートする柔軟性をより良く提供するために、品質と計算の複雑さとの間のトレードオフを実装するコーディングツールが、前述の高忠実度及び高効率アプローチの間の比較的大きなギャップを埋めるために、本明細書に記載される技術の下で提供される。例えば、これらのコーディングツールは、再構成されたHDR画像データのデコーダ側の達成可能な品質と、再構成されたHDR画像を生成するために使用される画像メタデータを生成するエンコーダ側計算コストとの間のトレードオフを提供するために使用することができる。
コンテンツプロバイダおよび/またはコンテンツ消費者は、リソース予算(計算コスト予算、エンドツーエンド又は個々のシステムの待ち時間予算、エンドツーエンド又は個々の遅延予算など)および再構成されたHDR画像データの視覚的な品質目標または目的に基づいて、コーディングツールの一部または全部を選択することができる。
これらのコーディングツールのいくつかまたは全ては、BL画像データ及び再構成されたHDR画像データの両方において色精度を達成するための技術を実装することができる。さらに、任意に、または代替的に、これらのコーディングツールの一部または全部は、いくつかの動作シナリオ(例えば、SDR画像データなど)で起こりやすいバンディングアーチファクトのリスクを軽減または低減する技術を実装することができる。PCT/US2019/054299に対してWO/2020/072651としても公開されている2019年8月13日に出願された米国仮特許出願第62/885,921号に記載されているようなバンディング低減をさらに改善するために、この技術を使用することができ、その全内容は、参照により本明細書に組み込まれる。
動的(例えば、画像依存的、画像特異的、シーン依存的、シーン特異的など)な三次元マッピングテーブル(d3DMT)のような前方マッピングテーブル(例えば、HDRコードワードを対応するSDRコードワードにマッピングするマッピング対などを含む)を使用して、前方再整形マッピング(例えば、前方再整形関数/曲線または多項式セット、前方ルックアップテーブルまたはFLUT、前方再整形多変量重回帰(MMR)係数など)を生成して、ソースHDR画像をSDR画像(またはBL画像データ)に前方再整形することができる。
後方d3DMTのような後方マッピングテーブル(例えば、SDRコードワードを対応するHDRコードワードにマッピングするマッピング対などを含む)を使用して、後方再整形マッピング(例えば、後方再整形関数/曲線または多項式セット、後方ルックアップテーブルまたはBLUT、後方再整形MMR係数など)を生成して、SDR画像を、ソースHDR画像を近似するHDR画像(または再構成されたHDR画像データ)に後方再整形することができる。
前方再整形されたSDR画像および後方再整形マッピングを指定する画像メタデータは、コーディングされたビットストリーム中にエンコードされて、受信するデコード/再生デバイスが直接SDR画像をレンダリングすること、またはSDR画像および後方再整形マッピングから構築された(後方再整形された)HDRをレンダリングすることを可能にする。
後方d3DMTは、対応する前方マッピングテーブル(前方d3DMT)から計算的に効率的に構築することができる。さらに、任意にまたは代替として、後方d3DMTは、ソースHDR画像および前方再整形されたSDR画像(一旦、前方再整形されたSDR画像が利用可能になると)を用いて直接構築されて、再整形マッピング精度を向上させることができる。
本明細書に記載されるd3DMTは、後方再整形マッピングを生成するために使用される前に、色空間のすべてのチャネルまたは平面のセットにおけるチャネルまたは平面の適切なサブセットの1つで更新され得る。いくつかの動作シナリオでは、d3DMTは、色空間の輝度(または輝度)チャネル/平面のみで更新され得、それによって、BLおよび/または再構成されたHDR画像データの色精度をある程度改善する。いくつかの動作シナリオでは、d3DMTは、輝度および色度(または色度)チャネル/平面(例えば、すべてなど)で更新され得、それによって、BLおよび/または再構成されたHDR画像データの色精度を比較的有意に改善する。
従って、色精度を含むがこれに限定されない再整形マッピング精度および対応する計算コストは、前方d3DMTの輝度チャネル/平面のみを更新することによって、または前方d3DMTの輝度および色度平面の両方を更新することによって、またはソースHDR画像および前方再整形SDR画像から後方d3DMTを直接構築することによって、調整可能とすることができる。
バンディングアーチファクトを軽減するために、ノイズ注入、BLUT修正などの一部または全部を実施することができる。例示的なノイズ注入および/またはBLUT修正は、前述の米国仮特許出願第62/885,921号に記載されている。
輝度BLUTのような輝度後方再整形マッピングの修正/更新は、再構成HDR画像の色精度に影響を与え、再構成HDR画像の色外観の意図しない変化を引き起こす可能性があることが観察される。
本明細書に記載されるような色補正操作は、再構成されたHDR画像内の色(例えば、バンディングアーチファクトを緩和した後など)がソースHDR画像内の色により近づくように、BLUT修正(例えば、バンディングアーチファクトを緩和するために使用される)によって影響を受ける画素の色を補正するために実施または実行することができる。さらに、任意または代替的に、ノイズ注入動作は、注入されたノイズをより視覚的に楽しめるように改善される。
本明細書に記載する例示的な実施形態は、画像再構成のための後方再整形マッピングを生成し、及びエンコードすることに関する。後方再整形マッピングテーブルは、前方再整形マッピングテーブルの逆として初めに生成される。前方再整形テーブルは、第2のダイナミックレンジのソース画像から第1のダイナミックレンジの前方再整形画像を生成するために前方再整形マッピングを生成するために使用される。第1のダイナミックレンジは、第2のダイナミックレンジよりも低い。前方再整形マッピングテーブルは、第2のダイナミックレンジのサンプリングされた輝度コードワード、第2のダイナミックレンジのサンプリングされた色度コードワード、第2のダイナミックレンジのサンプリングされた輝度コードワードに対応する第1のダイナミックレンジのコンテンツマッピングされた輝度コードワード、及び第2のダイナミックレンジのサンプリングされた色度コードワードに対応する第1のダイナミックレンジのコンテンツマッピングされた色度コードワードを含む。後方再整形マッピングテーブルは、コンテンツマッピング輝度コードワードを前方再整形輝度コードワードで置き換えることによって更新される。前方に再構成された輝度コードワードは、第2のダイナミックレンジのサンプリングされた輝度コードワードに輝度前方マッピングを適用することによって生成される。輝度の前方マッピングは、前方再整形マッピングテーブルから構成される。後方再整形マッピングテーブルと輝度前方マッピングを用いて、第1のダイナミックレンジの前方再整形画像から第2のダイナミックレンジの再構築画像を作成するための後方再整形マッピングを生成する。前方再整形画像は、後方再整形マッピングを指定する画像メタデータと共に、ビデオ信号内にエンコードされる。ビデオ信号の受信側デバイスは、後方再整形マッピングを前方再整形画像に適用し、第2のダイナミックレンジの再構成画像を生成する。
本明細書に記載される例示的な実施形態は、画像再構成およびレンダリングのための後方再整形マッピングのデコーディングに関する。第1のダイナミックレンジの前方再整形画像は、ビデオ信号からデコードされる。後方再整形マッピングを含む画像メタデータは、ビデオ信号からデコードされる。後方再整形マッピングは、後方再整形マッピングテーブルと輝度前方マッピングから上流画像処理デバイスによって生成した。後方再整形マッピングテーブルは、輝度前方マッピングを生成する前方再整形マッピングテーブルの逆数として、上流の画像処理デバイスによって最初に生成された。後方再整形マッピングテーブル中のコンテンツマッピング輝度コードワードは、前方再整形輝度コードワードで更新された。前方再整形輝度コードワードは、輝度前方マッピングをソース画像中のサンプリングされたソース輝度コードワードに適用することによって生成された。後方再整形マッピングを前方再整形画像に適用し、再構成画像を生成する。表示画像は、表示デバイスを用いて描画される再構成画像から導出される。
ビデオ配信処理パイプラインの例
図1Aは、ビデオキャプチャからビデオコンテンツディスプレイまでの様々な段階を示す、ビデオ配信パイプライン(100)の例示的なプロセスを示す。一連のビデオフレーム(102)は、画像生成ブロック(105)を用いて捕捉または生成される。ビデオフレーム(102)は、ビデオデータ(107)を提供するために、デジタル的に(例えば、デジタルカメラによって)キャプチャされるか、またはコンピュータによって(例えば、コンピュータアニメーションを使用して)生成され得る。さらに、任意にまたは代替として、ビデオフレーム(102)は、フィルムカメラによってフィルム上に捕捉されてもよい。フィルムは、ビデオデータ(107)を提供するためにデジタルフォーマットに変換される。制作フェーズ(110)では、ビデオデータ(107)は、ビデオ制作ストリーム(112)を提供するように編集される。
次に、制作ストリーム(112)のビデオデータが、制作後編集(115)のためにプロセッサに提供される。ポストプロダクション編集(115)は、ビデオ作成者の創造的意図に従って、画像の画質を向上させるか、または画像の特定の外観を達成するために、画像の特定の領域における色または輝度を調整または修正することを含んでもよい。これは、「カラータイミング」または「カラーグレーディング」と呼ばれることがある。他の編集(例えば、シーン選択およびシーケンス、手動および/または自動シーンカット情報生成、画像クロッピング、コンピュータ生成された視覚的特殊効果の追加など)は、HDR画像(117-1)またはSDR(または比較的狭いダイナミックレンジ)画像(117)のリリースバージョン(例えば、SDRなど)を生成するために、制作後編集(115)で実行され得る。いくつかの実施態様において、生産後編集(115)の間に、HDR画像(117-1)は、HDR画像(117-1)上で生産後編集操作を実行しているカラリストによって、高いダイナミックレンジをサポートする基準HDRディスプレイ上で観察される。さらに、任意に、または代替として、生産後編集(115)中に、SDR画像(117)は、SDR画像(117)上で生産後編集操作を実行しているカラリストによって、標準ダイナミックレンジ(または比較的狭いダイナミックレンジ)をサポートする参照ディスプレイ(125)上で観察される。さらに、任意にまたは代替として、SDR画像(117)は、HDR画像(117-1)からコンテンツマッピングされてもよい。
いくつかの実施形態では、コーディングブロック(120)は、デコードされたHDR画像データのデコーダ側品質と、後方再整形マッピングのエンコーダ側の計算の複雑性との間の種々の調整可能なトレードオフの一部または全部を実装することができる。コーディングブロック(120)は、制作後編集(115)からHDR画像(117-1)を受信し、HDR画像(117-1)を(前方)再整形されたSDR画像に前方再整形する。。
再整形されたSDR画像は、コーディングブロック(120)によって、コーディングされたビットストリーム(122)に、例えば、単一層に、圧縮/エンコードすることができる。例示的な単一層ビデオコーディング操作は、2017年3月22日に出願され、米国特許出願公開第2019/0110054号として公開された米国特許出願第16/087,241号に記載されており、その全内容は、参照により本明細書に組み込まれる。
いくつかの実施形態では、コーディングブロック(120)は、コーディングされたビットストリーム(122)を生成するために、ATSC、DVB、DVD、Blu-Ray、および他の配信フォーマットによって定義されるものなどのオーディオおよびビデオエンコーダを含んでもよい。
再整形されたSDR画像は、広範なSDRディスプレイデバイス(例えば、SDRディスプレイ等)と後方互換性のあるビデオ信号(例えば、8ビットSDRビデオ信号、10ビットSDRビデオ信号等)においてビデオデータにエンコードすることができる。非限定的な例では、再整形されたSDR画像でエンコードされたビデオ信号は、単一層の後方互換性ビデオ信号であってもよい。本明細書において、「単一層の後方互換ビデオ信号」は、単一信号層におけるSDRディスプレイ用に特に最適化された、またはカラーグレード付けされたSDR画像を搬送するビデオ信号を指すことができる。
いくつかの実施形態では、コーディングブロック(120)によって出力されるコーディングされたビットストリーム(122)は、コーディングブロック(120)によって生成される後方再整形マッピングを含むが、これに限定されない、画像メタデータと共に出力8ビットSDRビデオ信号を表すことができる。本明細書に記載される技術の下では、後方再整形マッピング(または構成者メタデータ)は、再構成されたHDR画像データのデコーダ側品質と後方再整形マッピングのエンコーダ側の計算の複雑性との間の調整可能なトレードオフオプションの特定のセット(例えば、コーディングブロック(120)を含むエンドツーエンドの単一レイヤ後方互換性エンコーディングパイプラインのコンテンツプロバイダおよび/またはコンテンツ消費者によって作成または選択される)に基づいて生成される。
後方再整形マッピングは、HDR(例えば、参照など)ディスプレイ上のレンダリングのために最適化され得る後方再整形画像を生成するために、再整形されたSDR画像上で後方再整形(例えば、逆トーンマッピングなど)を実行するために、下流のデコーダによって使用され得る。いくつかの実施形態では、後方再整形画像は、少なくとも部分的に後方再整形マッピング(または構成者メタデータ)に基づく逆トーンマッピングを実行する1つ以上のSDR-HDR変換ツールを使用して、再整形されたSDR画像(またはそのデコードされたバージョン)から生成されてもよい。本明細書で使用される、後方再整形は、再量子化された画像を元のEOTFドメイン(例えば、ガンマ、PQ、ハイブリッドログガンマまたはHLGなど)に戻し、ディスプレイ管理などのさらなる下流処理のために変換する画像処理操作を指す。例示的な後方再整形動作は、2015年3月20日に出願された米国仮出願第62/136,402号(米国特許出願公開第2018/0020224号として、2018年1月18日にも公開された)に記載されており、その内容全体は、本明細書に完全に記載されているかのように、参照により本明細書に組み込まれる。
さらに、任意に、または代替的に、コーディングされたビットストリーム(122)は、下流のデコーダによって使用され、HDR参照ディスプレイのための後方再整形画像上の表示管理動作を実行して、非基準HDRディスプレイなどの他のディスプレイ上のレンダリングに最適化された表示画像を生成することができる表示管理メタデータを含むが、これらに限定されない付加的な画像メタデータとともにエンコードされる。
次いで、コーディングされたビットストリーム(122)は、デコードおよび再生デバイス、メディアソースデバイス、メディアストリーミングクライアントデバイス、テレビジョンセット、セットトップボックス、映画館などの受信機に下流に送られる。受信機(または下流デバイス)において、コーディングされたビットストリーム(122)は、デコーディングブロック(130)によってデコードされ、デコードされた画像182を生成する。これは、再整形されたSDR画像と同じであってもよく、コーディングブロック(120)によって実行される圧縮およびデコーディングブロック(130)によって実行される復元において発生される量子化エラーを条件とする。
受信機が、標準ダイナミックレンジ又は標準ダイナミックレンジと同等以下の比較的狭いダイナミックレンジをサポートするターゲットディスプレイ140と共に動作する(又は取り付けられる)動作シナリオにおいて、デコーディングブロック(130)は、コーディングされたビットストリーム(122)から再整形SDR画像をデコードし、ターゲットディスプレイ(140)上のレンダリングのために、デコードされた再整形SDR画像を直接的又は間接的に使用することができる。ターゲットディスプレイ(140)がSDRリファレンスディスプレイ(125)と同様の特性を有する実施形態では、再整形されたSDR画像は、ターゲットディスプレイ(140)上で直接観察可能である。
いくつかの実施形態では、受信機は、高いダイナミックレンジ(例えば、400ニト、1000ニト、4000ニト、10000ニト以上など)をサポートするHDRターゲットディスプレイ140-1と共に動作する(またはこれに取り付けられる)ことにより、コード化されたビットストリーム(122)から構成者メタデータを抽出し、後方再整形メタデータ(構成者メタデータ)を使用して、後方再整形メタデータ(構成者メタデータ)に基づいて再整形されたSDR画像を後方再整形することによって、再整形されたSDR画像から後方再整形画像132-1を作製し、後方再整形画像(132-1)を直接または間接的にHDRターゲットディスプレイ(140-1)上のレンダリングに使用することができる。
後方再整形画像(132-1)は、同一ではなく、HDRターゲットディスプレイ(140-1)の最大輝度値またはピーク輝度値よりも大きい値をサポートするHDRディスプレイ(例えば、基準など)上で表示するために最適化することができる。受信機、HDRターゲットディスプレイ(140-1)内、または別のデバイス内にあるディスプレイ管理ブロック(135-1など)は、HDRターゲットディスプレイ(140-1)の特性に適合したディスプレイマップ信号(137-1)を生成することにより、HDRターゲットディスプレイ(140-1)の特性に合わせて、後方再整形画像(132-1)をさらに調整する。
ビデオコーデックと品質と複雑さのトレードオフ
図1Bは、再構成されたHDR画像の品質のデコーダ側と、後方再整形マッピングの生成のエンコーダ側計算複雑性との間のトレードオフの例を示す。本明細書に記載するコーディングブロック(例えば、ビデオエンコーダ、ビデオトランスコーダ、メディアストリーミングシステム、コンテンツ提供システムなど)は、コンテンツプロバイダおよび/またはコーディングブロックを含むビデオ処理システムで動作するコンテンツ消費者によって選択される特定のトレードオフオプションのセットで構成することができる(例えば、動的に、静的に、適応的に、スケジュールされるように、独立に、など)。
図1Bに示すように、例示的なトレードオフは、(a)ノイズ注入、(b) BLUT修正、(c)色補正などのいずれかを可能にまたは無効にする(オンまたはオフにする)こと、ならびに(d)d3DMTを更新(または構築)する際の異なるオプションを選択することを含むが、これらに限定されるものではない。いくつかの運用シナリオでは、BLUTの修正と色補正を可能にすることで、バンディングアーチファクトを緩和し、色の外観を改善し、再構成されたHDR画像の全体的な品質を改善することができる。
d3DMTの更新(または構築)における例示的なトレードオフオプション(例えば、コーディングブロックにおいて選択可能または調整可能)は、必ずしも限定されるものではないが、(1)d3DMTの前方への更新を行わない、(2)d3DMTの前方における輝度チャネル/平面の更新、(3)d3DMTの前方における輝度チャネル/平面および色度チャネル/平面の更新、(4)ソースHDR画像および前方再整形SDR画像に基づくd3DMTの後方の構築などを含むことができる。図1Bに示すように、これらの異なるオプションは、デコードされたHDR画像のデコーダ側品質の異なるカラーグレード、及び/又は後方再整形マッピングのエンコーダ側生成の異なる計算量(又は効率)を提供する。
図2Aおよび図2Bは、エンドツーエンドビデオ配信パイプラインにおけるビデオエンコーダ(例えば、図1Aのコーディングブロック(120)など)などの例示的なビデオコーデックを示す。本明細書に記載されるようなエンドツーエンドのビデオ送達パイプライン、またはその中のデバイスは、ソフトウェア、ハードウェア、ソフトウェアとハードウェアの組み合わせなどの1つ以上のコンピューティングデバイスを備えた本明細書に示されるものよりも多くても少なくてもよい処理ブロックによって実現されてもよい。限定ではなく例示として、いくつかまたはすべての処理フローおよび/またはデータフローは、括弧内に数字またはアルファベットでマークされる。図2Aおよび図2Bに示すように、これらの処理ブロックのいずれか、一部または全部は、エンドツーエンドのビデオ配信パイプライン内のビデオコードを構成するために、選択または(例えば、コンテンツプロバイダユーザ、コンテンツコンシューマユーザなどによって)選択または作成される(例えば、図1Bに示すような)トレードオフオプションの特定のセットに応じて、任意であってもよい。
図2A及び図2Bに示すように、本明細書に記載のビデオエンコーダは、HDRからSDRへのマッピング情報を生成するための「マッピング情報」ブロック、可逆SDR画像(又は前方再整形SDR画像)を生成するための「前方再整形」ブロック、画像メタデータ(「RPU」又は「rpu」と称する)を生成するための「後方再整形」ブロックを含み、これらのブロックは、可能な限り入力又は基準HDR画像に近いHDR画像(例えば、可逆SDRから後方再整形されたもの)を再構成するために受信デバイスによって使用されるべき後方再整形マッピングを含み得る。
図2Aのビデオエンコーダでは、図1Bに示されるような(a)ノイズ注入、(b)BLUT修正、および(c)色補正の一部または全部を有効にすることができ、図1Bに示されるようなd3DMT更新のオプション(d)(2)または(d)(3)のうちの1つを選択することができる。前述のように、図1Bのオプション(d)(2)は、前方d3DMTにおける輝度チャネル/平面の更新(例えば、のみ)に対応し、図1Bのオプション(d)(3)は、前方d3DMTにおける輝度チャネル/平面および色度チャネル/平面の更新に対応する。
図2Aの「マッピング情報」ブロックは、基準HDR画像からHDRカラーサンプルをサンプリング(または抽出)し、コンテンツマッピング(CM;例えば、芸術的な、またはカラリストの意図に基づいて実行される操作/動作、カラーグレーディング操作など)をこれらのHDRカラーサンプルに適用して、対応するSDRカラーサンプルなどを生成することを含む。ソースまたは基準HDR画像からHDRカラーサンプルをサンプリングするために使用されるサンプリング戦略の例には、以下のいずれかが含まれるが、これらに限定されるわけではない:基準HDR画像のすべての画素をサンプリングすること、基準HDR画像の比較的小さなセット(例えば、1/2、1/4、1/8、1/16など)をサンプリングすること、基準HDR画像の空間的寸法において均一または不均一にサンプリングすること、基準HDR画像の輝度コードワード/値の輝度分布において均一または不均一にサンプリングすること、など。
マッピング情報ステージでは、少なくとも部分的にサンプリング戦略に基づいて、3Dサンプリンググリッド(例えば、直線的な3Dグリッド、疎な3Dグリッド、頂点の均一または不均一な分布/密度を有する3Dグリッドなど)を構築することができる。様々な実施形態では、サンプルポイントは、3Dサンプリンググリッドに基づいて選択されても、されなくてもよい。いくつかの実施形態において、サンプルポイントは、密度分布に基づいて選択されてもよく、例えば、サンプルポイントは、密度分布に示されるように、画像に存在する色の有無に基づいて選択されてもよい。CMは、HDRサンプルポイントから対応するSDRサンプルポイントへのコンテンツマッピング(例えば、それだけ、等)を生成するために使用され得る。コンテンツマッピングは、すべての対応するSDR画素へのすべてのHDR画素(例えば、1920x1080空間分解能の画像の場合、200万画素以上)からのコンテンツマッピングではなく、比較的少数のサンプルポイント(例えば、10,000サンプルポイントなど)でのコンテンツマッピングのセットを含むことができ、従って、すべての画素に対するすべてのコンテンツマッピングよりもずっと軽く生成することができる。
HDR(例えば、カラー、コードワードなど)サンプルおよび対応するSDR(例えば、カラー、コードワードなど)サンプルは、前方d3DMT(例えば、多次元マッピングテーブル、ヒストグラムなど)を構築または生成するサンプルとして使用されるマッピング対を形成するために使用される。図2Aの「マッピング情報」ブロックは、さらに、文字ボックスがHDR画像内に存在するか否か、存在する場合には、文字ボックスの画素値を含むが、これらに限定されない、HDR画像からの文字ボックス情報を収集することを含んでもよい。
ビデオエンコーダは、PCT/US2019/031620に記載されているように、高効率低減基準(HERR)コーデックアーキテクチャを実装して、計算の複雑さを低減することができる。マッピング側の情報(マッピングサイド情報)-個々の画素の画素値(例えば、全て、実質的に全て、等々)を含む基準SDR画像の代わりに-が、マッピング情報ステージからビデオエンコーダの前方再整形ステージ、後方再整形ステージ等のその後の処理ステージへ送られることができる。HERRエンコード動作では、ソース(または基準)HDR画像とソース(または基準)HDR画像に関連するマッピング側の情報とを後の処理段階で使用して、前方再整形関数(例えば、FLUT、MMR係数など)を構築し、前方再整形関数に基づいてソースHDR画像を前方に再整形することによって(前方)再整形されたSDR画像を生成し、ソースHDR画像を近似する再構成されたHDR画像を生成するために、受信デバイス(または受信者ビデオデコーダ)によって使用される後方再整形画像メタデータを生成し、SLBCビデオ信号内の後方再整形画像メタデータとともに、再整形されたSDR画像をエンコードする。いくつかの運用シナリオでは、マッピング側の情報は、完全参照(フルリファレンス)SDR画像で表されるものと比較して、色の数を減らすことができる。
PCT/US2019/031620に記載されている高忠実度フルリファレンス(HFFR)モードでは、基準SDR画像は、ソースHDR画像の各画素にコンテンツマッピング(カラーマッピングなど)を適用することによって生成され、色度前方再整形のためのd3DMTを構築するために使用される。HFFRモードでは、基準SDR画像はSLBCビデオ信号にエンコードされず、色度前方再整形のためのd3DMTを構築するための近似基準として働く。従って、HFFRモードでは、各個々の画素レベル(例えば、画像中の百万画素の各々)で実行される多くのエンコーディング関連操作がある。
対照的に、PCT/US2019/031620に記載されているHERRモードでは、d3DMTは、各個々の画素レベルで完全参照SDR画像を生成又は操作することなく、低減された数の点(例えば、10,000点、100万点よりはるかに少ない点など)で、コンテンツマッピング情報(例えば、カラーマッピング情報など)のようなマッピング側の情報から生成することができる。その結果、大量の計算または関連する演算を節約または回避することができる。
フルリファレンスモードの場合と同様に、縮小リファレンスモードのマッピング情報段階でマッピング側の情報を生成するために、ソースHDR画像(フレームtと称する)中のコードワードは、各カラーチャネルについて、そのような各チャネルの最小および最大コードワード値に基づいてQ個のビンに分割することができる。全体として、
Figure 2023501885000002
個の3Dビンがある。正規化されていない最小コードワード値を、
Figure 2023501885000003
と示し、正規化されていない最大コードワード値を、
Figure 2023501885000004
と示し、ここで
Figure 2023501885000005
である。ビン
Figure 2023501885000006
の範囲は次のように表される。
Figure 2023501885000007
ここで、
Figure 2023501885000008
であり、
Figure 2023501885000009
であり、
Figure 2023501885000010
はHDR(またはEDR)のビット深度である。
HDR画素値(またはコードワード値)に対する3Dヒストグラム(
Figure 2023501885000011
として示される)は、ビンインデックス
Figure 2023501885000012
によって指定される3Dヒストグラム内の各3Dビンとともに収集される。各3DビンにおけるHDR画素値のチャネル固有の和(
Figure 2023501885000013
として示される)がそれぞれ計算される。(3Dヒストグラム
Figure 2023501885000014
非ゼロの画素数を有する空でないビンについては、チャネル固有の平均HDR画素値(またはコードワード値)(
Figure 2023501885000015
として示される)は、それぞれ、すべてのカラーチャネルについて計算することができ、空でないビンに表されるHDR画素値についてのマッピングされたSDR画素値は、それぞれ、すべてのカラーチャネルについての平均HDR画素値におけるコンテンツマッピングを用いて決定または計算することもできる。
Figure 2023501885000016
をKt個のビンとして示し、ここで、
Figure 2023501885000017
である。マッピングされたSDR画素値を
Figure 2023501885000018
として示し、チャネル固有の平均HDR画素値
Figure 2023501885000019
およびマッピングされたSDR画素値
Figure 2023501885000020
などのマッピング統計を収集するための例示的な手順を、下記の表1に示す。
Figure 2023501885000021
Figure 2023501885000022
Figure 2023501885000023
上記の表1に見られるように、フルリファレンスモードとは異なり、縮小リファレンスモードにおけるマッピングされたSDR画素値は、参照SDR画像における個々のSDR画素値を平均する代わりに、サンプリングされたポイントにおけるHDR画素値にコンテンツマッピング(カラーマッピングなど)を適用することによって得られる。このようなコンテンツマッピングは、d3DMTを表す3Dヒストグラム
Figure 2023501885000024
の非ゼロのビンにのみ適用される可能性がある。サンプリングされたHDR及びSDRコードワード統計
Figure 2023501885000025
を含む3Dヒストグラム
Figure 2023501885000026
によって表されるd3DMTは、ヒストグラム
Figure 2023501885000027
と共に、マッピング情報ステージから前方再整形ステージ及び/又は後方再整形ステージへのマッピング側情報として送られ、前方再整形ステージ及び後方再整形ステージにおける前方及び後方再整形関数を構築するために使用され得る。
図2Aの「前方再整形」ブロックは、前方d3DMTを用いて、前方d3DMTから得られたHDR輝度サンプル(例えば、HDRサンプルの輝度成分など)およびSDR輝度サンプル(例えば、対応するSDRサンプルの輝度成分など)の輝度ヒストグラムを構築し、累積密度関数(CDF)マッチングを適用して、輝度チャネル/プレーンなどのための前方ルックアップテーブル(FLUT)を形成または生成することを含む。例示的なCDFマッチング操作は、2017年9月11日に出願されたPCT出願第PCT/US2017/50980号、2016年10月5日に出願された米国仮出願第62/404,307号(米国特許出願公開第2018/0098094号として2018年4月5日にも公開されている)に記載されており、その全内容は、参照により本明細書に組み入れられる。
いくつかの実施形態では、CDFマッチングを使用して、前方再整形ルックアップテーブルを構築することができる。1D輝度ヒストグラムは、ソースHDR画像および各未サンプリングレベルの基準SDR画像からではなく、サンプリングポイント(例えば、HDRおよびSDR画像フレームの各々におけるサンプリンググリッドなど)におけるソースHDRコードワード値およびSDRコードワード値から生成されたd3DMTを使用して構築されてもよい。d3DMTを表す3Dヒストグラムは、マッピング情報ステージからマッピング側の情報で既に利用可能であるため、前方変更ステージは、輝度値が1D輝度ヒストグラムの同じ輝度ビンに対応する3Dヒストグラムのすべての3Dビンを合計することによって、1D輝度ヒストグラムを構築することができる。
CDFマッチングは、1D輝度ヒストグラムに基づいて補間FLUTを生成するために、CDFマッチングブロックによって実行され得る。補間されたFLUTは、平滑化されたFLUTを生成するために平滑化されてもよい。さらに、後方再整形LUT(BLUT)は、平滑化されたFLUTに表されるコードワードマッピングまたは曲線(例えば、8ピースの2次多項式など)を使用して、BLUT構成ブロック456によって構成されてもよい。
異なる計算コストを伴う1D輝度ヒストグラムを構築するための2つの例示的な方法または手順は、以下の表2および3に示されている。表2に示す第1の方法では、各ビンの重心が計算される。CDFマッチングは、セントロイドを使用して実行される。これは、比較的高コストの計算を必要とするが、比較的高精度のマッピングを生成する。表3に示す第2の方法では、各ビンは、その中間点で表され、これは、比較的低コストの計算で容易に決定することができる。2つの方法を以下に示す。
Figure 2023501885000028
Figure 2023501885000029
Figure 2023501885000030
Figure 2023501885000031
Figure 2023501885000032
Figure 2023501885000033
いくつかの運用シナリオでは、ブロック標準偏差(「BLKSTD」と表記)がHDR画像から計算される。バンディングアーチファクトのリスクは、BLKSTD(HDR画像から計算)およびFLUT(CDFマッチングで作成)から推定される。HDR画像のバンディングアーチファクトおよび/または輝度レベルのリスクに依存するノイズは、HDR画像の暗部またはHDR輝度チャネル/平面のサブレンジに(「(a)ノイズ注入」サブブロックで)注入されることがある。
例示的なブロック標準偏差計算およびバンディングアーチファクトリスク推定は、米国特許第10,032,262号に記載されており、その全体の内容は、本明細書に完全に記載されているかのように、参照により本明細書に組み込まれる。
さらに、レターボックス操作は、レターボックス処理操作を実行して、基準HDR画像内に存在し得る任意のレターボックスを処理して、前方に再整形されたSDR画像および/または再構成されたHDR画像内の正確な色を確実にするのを助けることができる。レターボックス処理操作の例は、前述のPCT特許出願第PCT/US2019/031620号に記載されている。
HDR画像のディザリングされた(またはノイズ注入された)HDR輝度チャネル/プレーンにFLUTを適用することにより、対応する前方再整形SDR画像のBL輝度チャネル/プレーン/コンポーネントを生成することができる。
HDR画像のHDR色度チャネル/平面に前方MMR係数を適用することにより、対応する前方再整形SDR画像のBL色度チャネル/平面/コンポーネントを生成することができる。前方MMR係数(色度前方再整形マッピングを表す)は、前方d3DMTおよび文字ボックス情報から計算することができる。
マッピング情報ステージからのd3DMTは、前方再整形ステージにおける無制約MMRマトリックス構築によって受信され得る。無制約最小二乗問題は、ソースHDR画像内の色度コードワード(該当する場合、任意のレターボックスソースHDR色度コードワードを含む)を再整形SDR画像内の再整形色度コードワード(該当する場合、任意のレターボックスリ成形SDR色度コードワードを含む)に転送するために使用されるMMR係数を解くために定式化することができる。
マッピングサイド情報で提供されるd3DMTから、2つのベクトルは、d3DMTを表す3Dヒストグラムの非ゼロのビン(または空でないビン)のSDR色度値を用いて、以下のように構成することができる:
Figure 2023501885000034
さらに、以下のように、非ゼロのビンの平均HDR画素値を用いて行列を構成することができる:
Figure 2023501885000035
ここで、
Figure 2023501885000036
これには、サポートされるすべてのMMR項が含まれている。
以下の関係式が成り立つとする。
Figure 2023501885000037
無制約のMMR係数は、次のように、無制約のMMR行列を用いて無制約の最小二乗問題を解くことによって、閉じた形で得られる:
Figure 2023501885000038
図2Aの「後方再整形」ブロックは、前述のPCT特許出願第PCT/US2019/031620号に記載されたヒストグラム強調BLUT構築法のようなヒストグラムベースの方法を用いて、FLUTから輝度チャネル/平面に対する後方ルックアップテーブルを構築し、BLUT修正(「(b)」と称する)を実行して、前方再整形されたSDR画像の後方再整形から生成された再構築されたHDR画像におけるバンディングアーチファクトのリスクを軽減または低減する。
図2Aの「前方再整形」ブロックによって生成されたFLUTおよび前方MMR係数は、(「(d)d3DMT更新」サブブロックにおいて)前方d3DMTから生成された後方d3DMTの(例えば、逆等としての)輝度および/または色度チャネル/平面におけるSDRコードワード/サンプルを更新するために使用される。修正されたBLUT(「(b)BLUT修正」サブブロックで生成された)は、「(c)色補正」サブブロックで使用され、色を修正するために、後方d3DMT内のHDR色度コードワード(例えば、値、サンプルなど)を修正し、それによって、再構成されたHDR画像の色の外観を改善する。後方再整形MMR係数は、更新された後方d3DMTと文字ボックス情報から計算することができる。
d3DMTは、後方再整形ステージにおける無制約MMRマトリックス構成によって受信され得る。無制約最小二乗問題は、再構成されたSDR画像内の色度コードワード(該当する場合、レターボックス再構成されたSDR色度コードワードを含む)を再構成されたHDR画像内の色度コードワード(該当する場合、レターボックス再構成されたHDR色度コードワードを含む)に戻すために使用されるMMR係数を解くために定式化され得る。
d3DMTから、d3DMTを表す3Dヒストグラムの非ゼロのビン(または空でないビン)の平均HDR色度値を用いて、2つのベクトルを次のように構成することができる:
Figure 2023501885000039
さらに、以下のように、非ゼロのビンのSDR画素値を用いて行列を構成することができる:
Figure 2023501885000040
ここで、
Figure 2023501885000041
これには、サポートされるすべてのMMR項が含まれている。
以下の関係式が成り立つとしよう。
Figure 2023501885000042
Figure 2023501885000043
無制約のMMR係数は、次のように、無制約のMMR行列を用いて無制約の最小二乗問題を解くことによって、閉じた形で得られる:
Figure 2023501885000044
BLUTと後方再整形MMR係数を含む(または指定する)後方再整形マッピングは、再整形されたSDR画像に付随する画像メタデータ(例えば、「rpu」など)の一部として、コード化されたビットストリームに出力されてもよい。
図1Bに示すいくつかの又は全てのトレードオフオプションの各々は、復号化されたHDR画像のデコーダ側品質とエンコーダ側計算コストとの間の特定の調整可能なトレードオフを達成するために、ビデオエンコーダを構成するように個別に選択又は作製することができる。第1のトレードオフオプションは、図2Aの処理サブブロック(a)を保持/除去することによって、ノイズ注入を有効/無効にするために行われてもよい。第2のトレードオフオプションは、図2Aの処理サブブロック(b)を保持/除去することによって、BLUT変更を有効/無効にするために行うことができる。第3のトレードオフオプションは、図2Aの処理サブブロック(c)を保持/除去することによって、色補正を有効/無効にするようにすることができる。d3DMT更新に関して、いくつかのトレードオフオプションを行うことができる。例えば、図2Aの処理サブブロック(d)を有効/無効にするために、第4のトレードオフオプションを行うことができる。第5のトレードオフオプションは、図2Aのデータフロー(2)および処理サブブロック(d)を維持するために行われてもよい。第6のトレードオフオプションは、図2Aのデータフロー(3)および処理サブブロック(d)を維持するために行われてもよい。
第7のトレードオフオプションが図2Bに示されている。このオプションの下では、後方再整形マッピングを生成するために使用される後方d3DMTは、基準HDR画像と、図2Bの(4)として示されるデータフローで提供される前方再整形SDR画像とから構成される。
要約すると、本明細書に記載されるような調整可能なトレードオフ技術は、後方再整形マッピングを生成し、ビデオコーデック間のエンドツーエンドビデオ配信をサポートするために使用され得る。エンコーダ側の計算リソースの利用可能性に従い、再構成されたHDR画像のデコーダ側の最適な品質を達成するために、ビデオエンコーダを構成するために、様々なトレードオフオプションを選択または作成することができる。
エンコーダ側および/またはデコーダ側の計算リソースの利用可能性は、特定の調整可能なトレードオフオプションを選択または作成するために(例えば、動的に、静的に、適応的に、など)使用され得る。本明細書に記載の例示的な計算リソースには、CPU消費量、DSP処理能力、メモリサイズ、キャッシュ、データストア、ネットワークリソース、レイテンシー、エンドツーエンドビデオ配信パイプラインの遅延などが含まれるが、これらに限定されない。
図2Cは、ビデオデコーダ(例えば、図1Aのデコーディングブロック(130)など)のような例示的なビデオコーデックを示し、これは、下流のビデオデコーダ(例えば、受信機など)内の1つ以上のコンピューティングプロセッサで実装することもできる。
図2Cに示すようないくつかの動作シナリオでは、単一層144内の(前方)再整形されたSDR画像及び画像メタデータ152によって符号化されたビデオ信号は、ビデオデコーダによる入力として、必ずしも上流のビデオエンコーダによって生成された後方整形マッピングのみを含むが、これに限定されない。
復元ブロック154(例えば、図1Aの解読ブロック(130)の一部など)は、ビデオ信号の単一層(144)内の圧縮ビデオデータを解読SDR画像(182)に解読/解読する。デコードされたSDR画像(182)は、コーディングブロック(120)および復元ブロック(154)における量子化誤差に従い、再整形されたSDR画像と同一であってもよく、これはSDRディスプレイデバイスに対して最適化されていた可能性がある。デコードされたSDR画像(182)は、出力SDRビデオ信号156に出力され、SDRディスプレイデバイスにレンダリングされる。
さらに、後方再整形ブロック158は、入力ビデオ信号から後方再整形マッピングを抽出し、画像メタデータ(152)において抽出された後方再整形マッピングに基づく最適後方再整形関数を構築し、再構築HDR画像(例えば、後方再整形HDR画像、図1Aの132-1、HDR参照画像の近似など)を生成するために、最適後方再整形関数に基づく再整形SDR画像に対する後方再整形操作を実行する。
いくつかの実施態様において、後方再整形されたHDR画像は、HDRターゲット/リファレンス表示デバイスに対して最適化された、生産品質又は生産品質に近いHDR画像を表す。後方再整形されたHDR画像は、出力HDRビデオ信号160に出力され、HDRディスプレイデバイスにレンダリングされる。一部の動作では、DMは、コストまたは待ち時間を低減するために受信機に実装されない場合がある。
さらに、任意に、または代替として、いくつかの動作シナリオにおいて、DMメタデータは、画像メタデータ(152)および再整形されたSDR画像内で受信機に送信され得る。HDR表示デバイスに特有の表示管理動作は、画像メタデータ(152)内のDMメタデータに少なくとも部分的に基づいて、例えば、HDR表示デバイス上にレンダリングされるHDR表示画像を生成するために、後方再整形されたHDR画像に対して実行されてもよい。
説明のために、単一層コーデックアーキテクチャが記載されている。本明細書に記載した技術は、図2Aから図2Cに示すもの以外の異なる単層コーデックアーキテクチャで使用することができることに留意されたい。さらに、任意にまたは代替として、これらの技術は、多層コーデックアーキテクチャにおいて使用することができる。従って、単層または多層コーデックアーキテクチャのこれらおよび他のバリエーションは、本明細書に記載の技術の一部または全部と共に動作可能である。
後方再整形のためのd3DMTの更新
前述のPCT特許出願第PCT/US2019/031620号に記載されているような高忠実度アプローチと高効率アプローチとの間の比較的大きなギャップの多くは、再構成HDR画像のデコーダ側品質及びエンコーダ側計算コスト(又は効率)に関して、色度チャネル/平面におけるSDR画像の後方再整形のための後方再整形MMR係数のような後方再整形マッピング(又は関数)を計算又は生成するために使用される方法に起因することができる。
一方、高効率アプローチは、前方d3DMTから直接後方再整形MMR係数を計算し、それによって、復号器側の再構成HDR画像の品質に著しい影響を与える誤差を導入する。これは、前方d3DMTが前方再整形に対して十分に正確であるが、後方再整形に対して十分に正確でない可能性があるためである。
色空間の単一(輝度)チャネル/平面で実行されるため、輝度の再整形は、再整形されたコードワード/値にある程度の誤差を生じやすい可能性がある。色度再整形のMMR予測では、さらなるエラーが発生する可能性がある。
図3Aは、前方d3DMT内の各エントリに対する前方再整形によって引き起こされるY、Cb(C0またはC0として示される)およびCr(C1またはC1として示される)の予測誤差の例を示す。これらの予測誤差は、前方d3DMTにおけるオリジナルのコードワード/値とFLUT/MMR予測コードワード/値との間の差異または偏差を表す。輝度予測誤差は、色度予測誤差よりも顕著である可能性がある。これらの予測誤差は、さらに後方再整形に伝播し、それにより、再構成されたHDR画像に比較的重大な誤差を生じる。
他方、高忠実度アプローチは、基準(またはソース)HDRおよび対応するSDR画像(例えば、前方再整形SDR画像など)から新しい後方d3DMTを構築し、それにより、かなりの計算コストおよび待ち時間を負う。
輝度チャネル/平面におけるSDRコードワード/値を予測するために使用されるFLUTと色度チャネル/平面におけるSDRコードワード/値を予測するために使用される前方MMR係数を最初に解いた/得た。次いで、後方再整形マッピングにおける前方再整形によって導入される予測誤差を修正または最小化するために、前方d3DMTに対応する後方d3DMTを、FLUT予測輝度SDRコードワード/値および前方MMR予測色度コードワード/値を用いた前方d3DMTのSDRエントリ内のコンテンツマッピングされたSDRコードワード/値(図2Aまたは図2Bの「マッピング情報」ブロック内のHDRコードワード/値/サンプルを、コンテンツマッピングすることによって生成された)を置換または修正することによって生成することができる。
以下のように、t番目のHDR基準画像(またはフレーム)のHDRサンプル(またはY、C0およびC1チャネル/平面のソースHDR値)から生成された前方d3DMT内のマッピング対と、HDRサンプルのコンテンツマッピングから生成された対応するSDRサンプル(またはコンテンツマッピングSDR値)のマッピング対を記述する:
Figure 2023501885000045
ここでKは、前方d3DMTのエントリまたは行の総数であり、
Figure 2023501885000046
は、マッピングテーブルのk番目のエントリのY、C0およびC1チャネル/平面におけるソースHDR値をそれぞれ示し、
Figure 2023501885000047
は、前方d3DMTのk番目のエントリのY、C0およびC1チャネル/平面におけるコンテンツマッピングSDR値を示す。kは0と(K-1)の間の整数である。
本明細書に記載されているマッピングテーブルのマッピング対は、HDR値のエントリ(例えば、上記式(1)の左側)のペア、およびSDR値の対応するエントリ(例えば、上記式(1)の右側)のペアを指す。本明細書に記載される技術の下では、マッピング対におけるこれらの値は、比較的高品質の後方再整形マッピングを生成する目的で更新され得る。
輝度チャネル/平面内のHDRコードワード/値からSDRコードワード/値を予測するために使用される前方FLUT(前方d3DMTから生成される)を、
Figure 2023501885000048
と記す。色度チャネル/平面C0およびC1におけるHDRコードワード/値からSDRコードワード/値を予測するために使用される前方MMR係数(前方d3DMTから生成される)を、それぞれ、
Figure 2023501885000049
と記すと、以下のようになる:
Figure 2023501885000050
ここで、MはMMRに基づく前方再整形マッピングにおける項の総数を表す。
SDRからHDRへのペアのマッピングを含む後方d3DMTは、最初、前方d3DMTの逆数として生成することができる。例えば、後方d3DMTを最初に前方d3DMTの逆数として構築する目的のために、前方d3DMT内のSDR値にマップされるHDR値を、後方d3DMT内のSDR値がマップされる対応するHDR値として使用することができる。
輝度チャネル/平面において、コンテンツマッピングされたSDRコードワード/値を、後方d3DMTにおけるFLUTで予測された前方に再構成されたSDRコードワード/値と置き換える例示的な手順を、以下の表4に示す。
Figure 2023501885000051
いくつかの運用シナリオでは、最初に前方d3DMTの逆数として生成された後方d3DMTのSDR輝度コード/値を更新した後、HDRからSDRへの修正後方d3DMTを次のように生成できる:
Figure 2023501885000052
前述したように、この後方d3DMTを構築するために、前方d3DMT内のSDR値にマップされるHDR値は、後方d3DMT内のSDR値がマップされる対応するHDR値として使用され得る。
色度チャネル/平面において、コンテンツマッピングされたSDRコードワード/値を、後方d3DMTにおける前方MMR係数で予測された前方再整形されたSDRコードワード/値と置き換える例示的な手順を、以下の表5に示す。
Figure 2023501885000053
一部の運用シナリオでは、最初に前方d3DMTの逆として生成された後方d3DMT内のSDR色度コードワード/値を更新した後、SDRからHDRへの修正後方d3DMTを次のように生成することができる:
Figure 2023501885000054
さらに、任意にまたは代替として、後方d3DMTのSDR輝度および色度コードワード/値を更新した後、SDRからHDRへの修正後の後方d3DMTを次のように生成することができる:
Figure 2023501885000055
再構成されたHDRコードワード/値を予測するために使用される後方MMR係数は、式(3)から(5)で表されるように修正された後方d3DMTから計算され得る。式(5)の更新された後方d3DMTを例にとる。行列を次のように構成する:
Figure 2023501885000056
ここで、
Figure 2023501885000057
は、MMR予測演算でサポートされるすべての(M個の)項を含む。
以下の関係式が成り立つとする:
Figure 2023501885000058
Figure 2023501885000059
Figure 2023501885000060
Figure 2023501885000061
Figure 2023501885000062
後方再整形のための後方MMR係数は、以下のように計算できる:
Figure 2023501885000063
Figure 2023501885000064
いくつかの運用シナリオでは、輝度チャネル/平面における後方再整形における予測誤差は、後方再整形色度チャネル/平面における予測誤差よりも重要である。さらに、後方d3DMTの更新/修正におけるSDR輝度コードまたは値の生成および更新は、SDR色度コードまたは値の生成および更新よりも計算的に効率的である。これらの運用シナリオでは、表4に示される処理は、表5に示される処理よりも高い優先度を与えられてもよい。
図4Aは、再構成されたHDR画像のデコーダ側品質と、後方再構成マッピングを生成するためにd3DMTを更新または構築するエンコーダ側計算コストとの間の調整可能なトレードオフのための例示的なプロセスフローを示す。いくつかの実施形態では、1つ以上の計算デバイスで実装されたビデオエンコーダは、このプロセスフローを実行することができる。
ブロック402は、前方d3DMTの更新/構築(または、その逆として最初に生成された対応する後方d3DMTの更新/構築)をサポートするために、デコーダ/再生デバイス等にビデオデータを配信することに関与する1つ以上のビデオコーデックの(例えば、ビデオエンコーダ、コーディングブロックのビデオエンコーダの)計算リソースが利用可能であるかどうかを判断することを含む。
ブロック404は、計算リソースが前方d3DMT(または後方d3DMT)のアップデート/ビルドをサポートするために利用できないという決定に応答して、後方MMR係数を計算するために後方d3DMTとして前方d3DMTの逆数を直接使用して、前方d3DMTに変更を加えることを回避することを含む。再構成されたHDR画像の第1のカラーグレードは、前方再整形されたSDR画像と、少なくとも部分的には後方MMR係数によって生成された対応する後方再整形マッピングを受信するビデオデコーダによって生成することができる。
第1のカラーグレードを生成するために、図3Bに示すように、ビデオエンコーダは、最初に、各ソース(または入力)HDR画像のHDRサンプル、およびソースHDR画像に対応するコンテンツマップSDR画像の対応するSDRサンプルから前方d3DMTを作成する。次いで、ビデオエンコーダは、後方d3DMTから導出された後方再整形MMR係数によって表される色度後方再整形関数を含むが、これに限定されない後方再整形マッピングを、前方d3DMTの逆数として計算する(前方d3DMTまたは後方d3DMTへの更なる更新なしに)。
本明細書中で使用されるように、異なる色グレードが、同じ視覚的意味内容を描写するために生成され得る。カラーグレードは、同一の視覚的意味内容を描写する再構成されたHDR画像の特定のバージョン(例えば、エンコーダ生成等)を参照することができる。
ブロック406は、前方d3DMT(または後方d3DMT)の更新/構築をサポートするために計算リソースが利用可能であることを決定することに応答して、利用可能な計算リソースの特定のレベルを決定することを含む。
いくつかの動作シナリオでは、複数の計算リソースレベルしきい値がビデオエンコーダのために構成され、利用可能な計算リソースの特定のレベルと比較するためにビデオエンコーダによって使用されてもよい。
ブロック408は、利用可能なコンピューティングリソースの特定のレベルおよび複数のコンピューティングリソースレベル閾値に基づいて、d3DMTを更新/構築するための、複数のトレードオフオプションの中の対応する特定のトレードオフオプションを決定することを含む。
例えば、利用可能なコンピューティングリソースの特定レベルを決定することに応答して、第1のコンピューティングリソースレベル閾値を超えるが第2のコンピューティングリソースレベル閾値を下回る場合(第1のコンピューティングリソースレベル閾値を上回る)、ビデオエンコーダは、表4に示すように、前方d3DMT(または対応する後方d3DMT)のSDR輝度コード/値を更新することができる。再構成されたHDR画像の第2のカラーグレードは、前方再整形されたSDR画像と、少なくとも部分的には更新されたd3DMTから導出された後方MMR係数によって生成された対応する後方再整形マッピングとを受信するビデオデコーダによって生成することができる。
第2のカラーグレードを生成するために、図3Bに示すように、ビデオエンコーダは、最初に、各ソース(または入力) HDR画像のHDRサンプル、およびソースHDR画像に対応するコンテンツマップSDR画像の対応するSDRサンプルから前方d3DMTを作成する。ビデオエンコーダは、前方d3DMTに基づく輝度前方再整形関数を生成し、前方d3DMT内の輝度コードワード/値(ただし、色度コード/値を更新しない)を更新するために輝度前方再整形関数を使用します。次に、ビデオエンコーダは、更新された後方d3DMTから導出された後方再整形MMR係数によって表される色度後方再整形関数を含むが、これに限定されない後方再整形マッピングを計算する。
利用可能なコンピューティングリソースの特定レベルが第2のコンピューティングリソースレベル閾値を上回るが、第3のコンピューティングリソースレベル閾値(第2のコンピューティングリソースレベル閾値を上回る)を下回る場合、ビデオエンコーダは、表4および5に示すように、前方d3DMT (または対応する後方d3DMT)のSDR輝度および色度コードワード/値を更新することができる。再構成されたHDR画像の第3のカラーグレードは、前方再整形されたSDR画像および対応する後方再整形マッピングを受信するビデオデコーダによって、少なくとも部分的に、更新されたd3DMTから導出された後方MMR係数によって生成することができる。
第3のカラーグレードを生成するために、図3Bに示すように、ビデオエンコーダは、最初に、各ソース(または入力) HDR画像のHDRサンプル、およびソースHDR画像に対応するコンテンツマップSDR画像の対応するSDRサンプルから前方d3DMTを作成する。ビデオエンコーダは、前方d3DMTに基づく輝度前方再整形関数を生成し、前方d3DMTに基づく色度前方再整形関数(例えば、前方再整形MMR係数など)を生成する。ビデオエンコーダは、輝度および色度前方再構成関数を使用して、前方d3DMTまたは前方d3DMTから後方として最初に生成された後方d3DMT内の輝度コード/値だけでなく、輝度コード/値を更新する。次に、ビデオエンコーダは、更新された後方d3DMTから導出された後方再整形MMR係数によって表される色度後方再整形関数を含むが、これに限定されない後方再整形マッピングを計算する。
利用可能な計算リソースの特定のレベルが第3の計算リソースレベルしきい値を上回ることに応答して、ビデオエンコーダは、HDRソース(または参照)画像および対応する前方再整形SDR画像を使用して、後方再整形のための(新規)後方d3DMT (例えば、前方d3DMTの逆数などを使用せずに)を構築し、構築された後方d3DMTに基づいて後方MMR係数を計算することができる。再構成されたHDR画像の第4のカラーグレードは、前方再整形されたSDR画像と、少なくとも部分的に、構築された後方d3DMTから導出された後方MMR係数によって生成された対応する後方再整形マッピングを受信するビデオデコーダによって生成することができる。
第4のカラーグレードを生成するために、図3Bに示すように、ビデオエンコーダは、最初に、各ソース(または入力) HDR画像のHDRサンプル、およびソースHDR画像に対応するコンテンツマップSDR画像の対応するSDRサンプルから前方d3DMTを作成する。ビデオエンコーダは、前方d3DMTに基づく輝度前方再整形関数を生成し、前方d3DMTに基づく色度前方再整形関数(例えば、前方再整形MMR係数など)を生成する。ビデオエンコーダは、輝度と色度の前方再整形関数を使用して、前方再整形SDR画像を生成する。次に、ビデオエンコーダは、ソースHDR画像及び前方再整形SDR画像に基づいて直接構築された後方d3DMTから導出された後方再整形MMR係数によって表される色度後方再整形関数を含むが、これに限定されない後方再整形マッピングを計算する。
BLUT修正
いくつかの動作シナリオでは、例示的なトレードオフオプションは、図1Bに示されるようなBLUT修正である。バンディングアーチファクトを示さずにSDRビンの利用可能なコードワードで表現できる最大輝度範囲をBLKSTDを用いて推定した。利用可能なコードワードによって表される実際の輝度範囲(例えば、バンディングアーチファクトなどを示す可能性がある)は、BLUTから計算される。特定の輝度コードワード/値(例えば、として示されるなど)の上のBLUT部分(例えば、最も明るい、天井の輝度コードワード/値の下の最も明るいなど)は、最大輝度範囲と実際の輝度範囲の間の比に基づいて修正されることがある。さらに、任意にまたは代替的に、暗(例えば、最も暗く、床の輝度コード/値より上で最も暗い) BLUT部分は、ノイズ注入操作の一部として変更されてもよい。例示的なBLUT修正およびノイズ注入は、前述の米国仮特許出願第62/885,921号に記載されている。
本明細書に記載されるように、ビデオエンコーダにおけるBLUTの変更を可能にすることは、再構成されたHDR画像の明るい領域におけるバンディングアーチファクトを緩和または低減することができ、それによって、これらの再構成されたHDR画像の視覚品質を大幅に改善することができる。
BLUT修正のための色補正
いくつかの運用シナリオでは、BLUT修正は明るい領域のバンディングアーチファクトを緩和することができるが、例えば、BLUT修正によって輝度コード/値が変化するような、衝突した画素の色の外観が変化する可能性があることが観察される。例えば、バンディングアーチファクトが、BLUTの変更によって再構成されたHDR画像の太陽周囲の空から除去された場合、再構成されたHDR画像の空の色は、BLUTの変更を伴わない再構成されたHDR画像よりも飽和して見える可能性がある。
一般に、画素の輝度値を減少させると、画素の色がより飽和して見えるようになる可能性があり、画素の輝度値を増加させると、画素の色度値が変わらない場合、画素の色がより飽和して見えなくなる可能性があります。
サチュレーションが実際に変化することを意味しないかもしれませんが、視聴者が視覚的に知覚する画素の色の外観は、同じ色度値に対して異なる輝度値で異なります。
いくつかの運用シナリオでは、画素の対応する色度値(BLUT修正によって変更された画素の輝度値に対応する)は、これらの画素の色の外観が、ソース(例えば、参照、入力など) HDR画像の色に比較的近く見えるように修正されてもよい。変更されたBLUTと元のBLUT(BLUTの変更によって変更されない)との比率は、彩度値を調整するための不飽和(または色度スケーリング)関数として使用される。
元のBLUTを、
Figure 2023501885000065
と記し、バンディングアーチファクトを抑制する改良型BLUTを、
Figure 2023501885000066
と記すことにする。BLUTは(例えば、正規化、非正規化等された)SDR輝度値を(例えば、正規化、非正規化等された)HDR輝度値にマッピングする。
例示のみを目的として、色度値は、YCbCr、ICtCp、IPTPQなどを含むが、これらに限定されない色空間で表現され、正規化ドメイン[0 1]の色度値は、オフセット0.5で表現される。したがって、色度値が0.5の場合、ニュートラルカラー(グレイスケール)を意味します。色度値(またはその彩度/色の外観)を調整するために、オフセットを色度値から除去することができる。
色度チャネル/平面において、入力(または参照) HDR色度コードワード/値を、後方d3DMT内の不飽和HDRコードワード/値で置き換える例示的な手順を、以下の表6に示す。これにより、入力(または参照) HDR色度コードワード/値の代わりに、不飽和HDRコードワード/値が、本明細書に記載されるような後方再構成マッピングによって生成される再構成HDRコードワード/値によって近似される。
Figure 2023501885000067
一部の運用シナリオでは、前方d3DMTの後方として最初に生成された後方d3DMTにおいて、HDR色度コードワード/値を更新した後(およびコンテンツマッピングされたSDRコードワード/値を前方再構成されたSDRコードワード/値に置き換えた後)、HDRからSDRへの修正後の後方d3DMTを次のように生成することができる:
Figure 2023501885000068
次いで、後方再整形マッピングにおける後方MMR係数を、後方d3DMTから計算することができる。
表6に示されるような不飽和関数
Figure 2023501885000069
のパラメータβは、元の(例えば、トレーニング中などの)HDR画像のカラー外観と、色度値が不飽和で色度値が不飽和でない対応する再構成されたHDR画像のカラー外観の経験的研究を通して、実際の値が決定またはチューニングされ得るチューニングパラメータを表す。パラメータβの値の例としては、1.5、2、2.5、3、3.5などのうちの1つが挙げられるが、必ずしもこれらに限定されない。
表6に示すように、C0またはCbチャネルの不飽和色度値
Figure 2023501885000070
は、2つの項を含む。第1項
Figure 2023501885000071
は、ニュートラルグレー値0.5からの不飽和色度値の偏差を表す。したがって、C0またはCbチャネルの不飽和色度値
Figure 2023501885000072
の第1項が比較的小さい場合、不飽和色度値
Figure 2023501885000073
は、ニュートラルグレー値0.5に比較的近い値に調整される。その結果、この非飽和色度値
Figure 2023501885000074
を有する画素の色は、ニュートラルグレー値0.5に比較的近く調整されたので、対応する調整前の色度値
Figure 2023501885000075
を有する画素よりも不飽和化される。
同様に、C1またはCrチャネルの不飽和色度値
Figure 2023501885000076
は、2つの項を含む。第1項
Figure 2023501885000077
は、ニュートラルグレー値0.5からの不飽和色度値の偏差を表す。したがって、C1またはCbチャネルの不飽和色度値
Figure 2023501885000078
の第1項が比較的小さい場合、不飽和色度値
Figure 2023501885000079
は、ニュートラルグレー値0.5に比較的近い値に調整される。その結果、この非飽和色度値
Figure 2023501885000080
を有する画素の色は、ニュートラルグレー値0.5に比較的近く調整されたので、対応する調整前の色度値
Figure 2023501885000081
を有する画素よりも不飽和化される。
図3Cは、様々な色グレード(例えば、図3Bに示されるような色グレード2~4など)における任意の色グレードに適用可能な色補正の例を示す。一例として、ビデオエンコーダは、本明細書に記載されているように、後方d3DMTに基づいて(例えば、修正前の、等)BLUTのような輝度後方再整形関数を生成する。次に、ビデオエンコーダは、バンディングアーチファクト(例えば、そのリスク等)を低減するためにBLUTを修正する。ビデオエンコーダは、修正前のBLUTおよび修正されたBLUTを使用して、後方d3DMT内のHDR色度コードワード/値を更新するために、不飽和関数を生成する(例えば、上記の表6に示される比率などとして)。次に、ビデオエンコーダは、更新された後方d3DMTから導出された後方再整形MMR係数によって表される色度後方再整形関数を含むが、これに限定されない後方再整形マッピングを計算する。
図3Dは、(図3Bに示されるように)カラーグレード2に対するd3DMTアップデート動作と関連して実行される例示的な色補正を示す。ビデオエンコーダは、最初に、各ソース(または入力) HDR画像のHDRサンプル、およびソースHDR画像に対応するコンテンツマップSDR画像の対応するSDRサンプルから前方d3DMTを構築する。ビデオエンコーダは、前方d3DMTに基づく輝度前方再整形関数を構築または生成します。ビデオエンコーダは、前方d3DMTまたは前方d3DMTから逆変換として最初に生成された後方d3DMTの輝度コード/値を更新するために、輝度前方再編成関数を使用します。次いで、ビデオエンコーダは、後方d3DMTに基づく輝度後方再整形関数を構築または生成する。ビデオエンコーダは、バンディングアーチファクトを低減するためにBLUTをさらに修正する。ビデオエンコーダは、予め修正されたBLUTおよび修正されたBLUTを使用して、後方d3DMT内のHDR色度コードワード/値を更新するために、不飽和関数を生成する(例えば、上記の表6に示される比率など)。続いて、ビデオエンコーダは、更新された後方d3DMTから導出された後方再整形MMR係数によって表される色度後方再整形関数を含むが、これに限定されない後方再整形マッピングを計算する。
後方再整形マッピングと時間的安定性
図3Eは、輝度更新、BLUT修正、および色補正を伴う後方再整形マッピング生成の例を示す。ブロック302は、ソースHDR画像のサンプリングされたHDRコードワードと、対応するコンテンツマッピングされたSDRコードワードとを用いてd3DMTを構築することを含み、これらの各々は、所与のソースHDD画像についてのHDRコードワードとSDRコードワードとの間の複数のマッピング対を含む。ブロック304は、各d3DMT内の複数のマッピング対に基づいて、前方ルックアップテーブルのような対応する輝度前方再整形関数を構築することを含む。ブロック306は、各d3DMT内の複数のマッピング対に基づいて、前方MMR係数によって表される対応する前方色度マッピングを構築することを含む。ブロック308は、コンテンツマッピングされたSDR輝度コードワードを、FLUTで予測された前方に再構成されたSDRコードワードで置き換えることによって、各d3DMT内の複数のマッピング対内のSDR輝度コードを更新することを含む。ブロック310は、FLUTから輝度後方再整形関数(BLUT)を構築することを含む。ブロック312は、バンディングアーチファクトのリスクを軽減または低減するためにBLUTを修正することを含む。ブロック314は、サンプリングされたHDR色度コードワードを、元のBLUTおよび修正されたBLUTに基づいて生成された不飽和HDR色度コードワードで置き換えることによって、各d3DMT内の複数のマッピング対におけるHDR色度コードワードを整流することを含む。ブロック316は、更新された輝度SDRコードワード及び更新された色度HDRコードワードを有する複数のマッピング対を含む更新されたd3DMTに基づいて、ソースHDR画像の1つに対応する各前方再整形されたSDR画像に対する色度後方再整形マッピング(例えば、色度後方再整形関数、後方(再整形) MMR係数等)を計算することを含む。
いくつかの運用シナリオでは、画像メタデータの時間的安定性を維持する目的で、画像メタデータの後方再整形マッピングを計算/生成/含める際に、線形セグメントベースの構造を使用することができる。例示的な線形セグメントベースの構造は、2018年1月4日に公開された米国特許出願第2018/0007356号に記載されており、その全体の内容は、本明細書に完全に記載されているかのように、参照により本明細書に組み込まれる。
本明細書に記載されるいくつかのまたは全ての技術は、放送ビデオアプリケーション、リアルタイムストリーミングアプリケーションなどのための適切なカラーグレードのビデオコンテンツを生成するために、リアルタイム動作の一部として実装および/または実行することができる。さらに、任意にまたは代替として、本明細書に記載されるいくつかのまたは全ての技術を、時間遅延またはオフライン動作の一部として実装および/または実行して、非リアルタイムストリーミングアプリケーション、シネマアプリケーションなどのための適切なカラーグレードのビデオコンテンツを生成することができる。
プロセスフローの例
図4Bは、一実施形態による例示的なプロセスフローを示す図である。いくつかの実施形態では、1つ以上のコンピューティングデバイスまたはコンポーネント(例えば、エンコードデバイス/モジュール、トランスコードデバイス/モジュール、デコードデバイス/モジュール、逆トーンマッピングデバイス/モジュール、トーンマッピングデバイス/モジュール、メディアデバイス/モジュール、逆マッピング生成およびアプリケーションシステムなど)が、このプロセスフローを実行してもよい。ブロック422において、画像処理システムは、前方再整形テーブルの逆として、最初に後方再整形テーブルを生成する。
前方再整形テーブルは、第2のダイナミックレンジのソース画像から第1のダイナミックレンジの前方再整形画像を生成するために前方再整形マッピングを生成するために使用される。第1のダイナミックレンジは、第2のダイナミックレンジよりも低い。前方再編成マッピングテーブルは、第2のダイナミックレンジのサンプリングされた輝度コードワード、第2のダイナミックレンジのサンプリングされた色度コードワード、第2のダイナミックレンジのサンプリングされた輝度コードワードに対応する第1のダイナミックレンジのコンテンツマッピングされた輝度コードワード、及び第2のダイナミックレンジのサンプリングされた色度コードワードに対応する第1のダイナミックレンジのコンテンツマッピングされた色度コードワードを含む。
ブロック424において、画像処理システムは、コンテンツマッピングされた輝度コードワードを前方に再構成された輝度コードワードで置き換えることによって、後方再構成マッピングテーブルを更新する。前方に再構成された輝度コードワードは、第2のダイナミックレンジのサンプリングされた輝度コードワードに輝度前方マッピングを適用することによって生成される。輝度の前方マッピングは、前方再整形マッピングテーブルから構成される。
ブロック426では、画像処理システムは、第1のダイナミックレンジの前方再整形画像から第2のダイナミックレンジの再構成画像を作成するために、後方再整形マッピングを生成するために、後方再整形マッピングテーブルと輝度前方マッピングを使用する。
ブロック428では、画像処理システムは、後方再整形マッピングを指定する画像メタデータと共に、前方再整形画像をビデオ信号で符号化する。ビデオ信号の受信側デバイスは、後方再整形マッピングを前方再整形画像に適用し、第2のダイナミックレンジの再構成画像を生成する。
一実施形態では、画像処理システムは、エンドツーエンドのビデオ配信パイプラインで利用可能な計算リソースを決定すること、利用可能な計算リソースを使用して、第2のダイナミックレンジの復号化画像のデコーダ側品質と、後方再整形マッピングを生成するエンコーダ側計算複雑性との間の特定のトレードオフオプションのセットを決定すること、後方再整形マッピングを生成するための特定のトレードオフオプションのセットに従って画像処理動作の特定のセットを実行すること、を実行するようにさらに構成される。
一実施形態では、画像処理システムは、さらに、表示画像を再構成画像から導出し、ビデオ信号の受信デバイスで描画させるように構成される。
一実施形態では、画像処理システムは、コンテンツマッピングされた色度コードワードを前方再整形された色度コードワードで置き換えることによって、後方再整形マッピングテーブルを更新するようにさらに構成される。前方再構成された色度コードワードは、多変量重回帰(MMR)色度前方マッピングを第2のダイナミックレンジのサンプリングされた輝度と色度コードワードに適用することによって生成される。MMR色度前方マッピングは、前方再整形マッピングテーブルから構成される。
一実施形態では、画像処理システムは、サンプリングされた色度コードワードを不飽和色度コードワードで置き換えることによって、後方再整形マッピングテーブルを更新するようにさらに構成される。
一実施形態では、不飽和化された色度コードワードは、サンプリングされた色度コードワードに不飽和関数を適用することによって生成され、不飽和関数は、修正された輝度後方再整形マッピングと元の輝度後方再整形マッピングとの間の比として構築される。
一実施形態では、画像処理システムは、再構成画像内のバンディングアーチファクトを低減するために、後方ルックアップテーブル修正を適用させるようにさらに構成される。
一実施形態では、後方マッピングテーブル及び前方マッピングテーブルのうちの少なくとも1つは、ソース画像及び前方再整形画像から少なくとも部分的にダイナミックに構築された三次元マッピングテーブルを表す。
一実施形態では、輝度前方マッピングは、輝度ルックアップテーブルによって表される。
一実施形態では、第2のダイナミックレンジの再構成された画像は、第2のダイナミックレンジのソース画像を近似する。
一実施形態では、ビデオ信号は、単一層の後方互換性ビデオ信号を表す。
図4Cは、本発明の一実施形態による例示的なプロセスフローを示す図である。いくつかの実施形態では、1つ以上のコンピューティングデバイスまたはコンポーネント(例えば、符号化デバイス/モジュール、トランスコーディングデバイス/モジュール、復号化デバイス/モジュール、逆トーンマッピングデバイス/モジュール、トーンマッピングデバイス/モジュール、メディアデバイス/モジュール、予測モデルおよび特徴選択システム、逆マッピング生成およびアプリケーションシステムなど)は、このプロセスフローを実行してもよい。ブロック442では、ビデオ復号システムは、ビデオ信号から、第1のダイナミックレンジの前方再整形画像を復号する。
ブロック444では、ビデオ復号化システムは、ビデオ信号から、後方再整形マッピングを含む画像メタデータを復号化する。
後方再整形マッピングは、後方再整形マッピングテーブルと輝度前方マッピングから上流画像処理デバイスによって生成した。後方再整形マッピングテーブルは、輝度前方マッピングを生成する前方再整形マッピングテーブルの逆数として、上流の画像処理デバイスによって最初に生成された。後方再整形マッピングテーブル中のコンテンツマッピング輝度コードワードは、前方再整形輝度コードワードで更新された。前方再整形輝度コードワードは、輝度前方マッピングをソース画像中のサンプリングされたソース輝度コードワードに適用することによって生成された。
ブロック446では、ビデオ復号化システムは、再構成画像を生成するために、前方再整形画像に後方再整形マッピングを適用する。
ブロック448では、ビデオ復号化システムは、再構成された画像から導出された表示画像を表示デバイスで描画させる。
一実施形態では、ディスプレイデバイス、モバイルデバイス、セットトップボックス、マルチメディアデバイスなどの計算デバイスは、前述の方法のいずれかを実行するように構成される。一実施形態では、装置は、プロセッサを備え、前述の方法のいずれかを実施するように構成される。一実施形態では、ソフトウェア命令を記憶する非一時的コンピュータ読取可能記憶媒体であって、1つ以上のプロセッサによって実行されると、前記方法のいずれかの性能を引き起こす。
一実施形態では、1つ以上のプロセッサと、1つ以上のプロセッサによって実行された場合に前記方法のいずれかの性能を引き起こす命令のセットを記憶する1つ以上の記憶媒体とを備える計算デバイス。
別個の実施形態が本明細書で議論されるが、本明細書で議論される実施形態および/または部分的実施形態の任意の組み合わせが、さらなる実施形態を形成するために組み合わされ得ることに留意されたい。
コンピュータシステムの実装例
本発明の実施形態は、コンピュータシステム、電子回路および電子部品に構成されるシステム、マイクロコントローラなどの集積回路、フィールドプログラマブルゲートアレイ、または他の構成可能またはプログラマブルロジックデバイス、離散時間またはデジタル信号プロセッサ、特定用途向けIC、および/またはこれらのシステム、デバイスまたはコンポーネントの1つ以上を含む装置を用いて実施することができる。コンピュータおよび/またはICは、本明細書に記載されるような、拡張されたダイナミックレンジを有する画像の適応知覚量子化に関する命令を実行、制御、または実行することができる。コンピュータおよび/またはICは、本明細書に記載される適応知覚量子化プロセスに関連する様々なパラメータまたは値のいずれかを計算することができる。画像およびビデオの実施形態は、ハードウェア、ソフトウェア、ファームウェア、およびそれらの様々な組み合わせで実装することができる。
本発明の特定の実装は、プロセッサに本開示の方法を実行させるソフトウェア命令を実行するコンピュータプロセッサを含む。例えば、ディスプレイ、エンコーダ、セットトップボックス、トランスコーダ等における1つ以上のプロセッサは、プロセッサにアクセス可能なプログラムメモリにおいてソフトウェア命令を実行することによって、上述したようなHDR画像の適応知覚量子化に関連する方法を実施することができる。本発明の実施形態はまた、プログラム製品の形態で提供されてもよい。プログラム生成物は、データプロセッサによって実行されると、データプロセッサに本発明の実施形態の方法を実行させる命令を含む一組のコンピュータ読取可能な信号を担持する任意の非一時的媒体を含んでもよい。本発明の実施形態によるプログラム製品は、多種多様な形態のいずれであってもよい。プログラム製品は、例えば、フロッピーディスケットを含む磁気データ記憶媒体、ハードディスクドライブ、CD-ROMを含む光データ記憶媒体、DVD、ROMを含む電子データ記憶媒体、フラッシュRAM等の物理媒体を含むことができる。プログラム生成物上のコンピュータ読取可能信号は、任意に圧縮または暗号化されてもよい。
構成要素(例えば、ソフトウェアモジュール、プロセッサ、アセンブリ、デバイス、回路等)が上記で言及されている場合、別段の指示がない限り、当該構成要素への言及(「手段」への言及を含む)は、本発明の例示的実施形態において関数を実行する開示された構造と構造的に等価でない構成要素を含む、説明された構成要素の関数を実行する(例えば、関数的に同等である)任意の構成要素を含む、当該構成要素の等価物として解釈されるべきである。
一実施形態によれば、本明細書に記載される技術は、1つ以上の専用目的のコンピューティングデバイスによって実装される。専用目的の計算デバイスは、技術を実行するためにハードワイヤード配線されてもよく、または技術を実行するために永続的にプログラムされた1つ以上の特定用途向け集積回路またはフィールドプログラマブルゲートアレイのようなデジタル電子デバイスを含んでもよく、またはファームウェア、メモリ、他の記憶デバイス、または組み合わせのプログラム命令に従って技術を実行するためにプログラムされた1つ以上の汎用ハードウェアプロセッサを含んでもよい。このような特殊目的のコンピューティングデバイスはまた、カスタムハードワイヤードロジック、ASIC、またはFPGAをカスタムプログラミングと組み合わせて、技術を達成することもできる。特殊目的の計算デバイスは、デスクトップコンピュータシステム、ポータブルコンピュータシステム、ハンドヘルドデバイス、ネットワーキングデバイス、またはこの技術を実施するためにハードワイヤードおよび/またはプログラムロジックを組み込んだ他の任意のデバイスであってもよい。
例えば、図5は、本発明の一実施形態を実装することができるコンピュータシステム500を示すブロック図である。コンピュータシステム500は、情報を通信するためのバス502または他の通信メカニズムと、情報を処理するためのバス502と結合されたハードウェアプロセッサ504とを含む。ハードウェアプロセッサ504は、例えば、汎用マイクロプロセッサであってもよい。
コンピュータシステム500はまた、プロセッサ504によって実行される情報および命令を記憶するためにバス502に結合された、ランダムアクセスメモリまたは他の動的記憶デバイスのようなメインメモリ506を含む。主メモリ506はまた、プロセッサ504によって実行される命令の実行中に、一時変数または他の中間情報を記憶するために使用されてもよい。このような命令は、プロセッサ504にアクセス可能な非一時的記憶媒体に記憶されると、命令に指定された操作を実行するようにカスタマイズされた専用マシンにコンピュータシステム500をレンダリングする。
コンピュータシステム500は、さらに、バス502に結合された読み出し専用メモリ508または他のスタティック記憶デバイスを含み、プロセッサ504のためのスタティック情報および命令を記憶する。情報および命令を記憶するために、磁気ディスクまたは光ディスクなどの記憶デバイス510が設けられ、バス502に結合される。
コンピュータシステム500は、バス502を介して、コンピュータユーザに情報を表示するための液晶ディスプレイのようなディスプレイ512に結合することができる。入力デバイス514は、英数字及び他のキーを含み、情報及びコマンド選択をプロセッサ504に通信するためにバス502に結合される。別のタイプのユーザ入力デバイスは、マウス、トラックボール、またはカーソル方向キーなどのカーソル制御デバイス516であり、方向情報およびコマンド選択をプロセッサ504に通信し、ディスプレイ512上のカーソルの動きを制御する。この入力デバイスは、典型的には、第1の軸(例えば、x)および第2の軸(例えば、y)の2つの軸における2つの自由度を有し、デバイスが平面内の位置を指定することを可能にする。
コンピュータシステム500は、カスタマイズされたハードワイヤードロジック、1つ以上のASICまたはFPGA、ファームウェア、および/またはプログラムロジックを使用して、本明細書に記載の技術を実装することができ、これらは、コンピュータシステムと組み合わせて、コンピュータシステム500を専用マシンにするか、またはプログラムする。一実施形態によれば、本明細書に記載される技術は、主メモリ506に含まれる1つ以上の命令の1つ以上のシーケンスを実行するプロセッサ504に応答して、コンピュータシステム500によって実行される。そのような命令は、記憶デバイス510のような別の記憶媒体からメインメモリ506に読むことができる。メインメモリ506に含まれる命令のシーケンスの実行により、プロセッサ504は、本明細書に記載のプロセスステップを実行する。別の実施形態では、ハードワイヤード回路が、ソフトウェア命令の代わりに、またはソフトウェア命令と組み合わせて使用されてもよい。
本明細書で使用される用語「記憶媒体」は、デバイスを特定の態様で動作させるデータおよび/または命令を記憶する任意の非一時的媒体を指す。そのような記憶媒体は、不揮発性媒体および/または揮発性媒体を含んでもよい。不揮発性媒体は、例えば、記憶デバイス510のような光ディスクまたは磁気ディスクを含む。揮発性媒体は、メインメモリ506のようなダイナミックメモリを含む。記憶媒体の一般的な形態としては、例えば、フロッピーディスク、フレキシブルディスク、ハードディスク、ソリッドステートドライブ、磁気テープ、または他の任意の磁気データ記憶媒体、CD-ROM、他の任意の光学データ記憶媒体、穴パターンを有する任意の物理媒体、RAM、PROM、およびEPROM、FLASH(登録商標)-EPROM、NVRAM、他の任意のメモリチップまたはカートリッジが挙げられる。
記憶媒体は、伝送媒体とは区別されるが、伝送媒体と共に使用することができる。伝送媒体は、記憶媒体間の情報の転送に関与する。例えば、伝送媒体は、バス502を構成するワイヤを含む同軸ケーブル、銅線および光ファイバを含む。伝送媒体は、また、無線波及び赤外線データ通信の間に発生されるような音波又は光波の形態をとることができる。
1つ以上の命令の1つ以上のシーケンスを実行のためにプロセッサ504に搬送することには、様々な形態の媒体が関与し得る。例えば、命令は、最初、遠隔コンピュータの磁気ディスクまたはソリッドステートドライブ上で実行されてもよい。遠隔コンピュータは、命令をそのダイナミックメモリにロードし、モデムを使用して電話回線を介して命令を送信することができる。コンピュータシステム500のモデムローカルは、電話回線上のデータを受信し、赤外線送信機を使用して、データを赤外線信号に変換することができる。赤外線検出器は、赤外線信号内に搬送されたデータを受信することができ、適切な回路は、バス502上にデータを配置することができる。バス502はデータをメインメモリ506に運び、そこからプロセッサ504が命令を取り出して実行する。メインメモリ506によって受信された命令は、任意に、プロセッサ504による実行の前または後のいずれかで、記憶デバイス510上に記憶することができる。
コンピュータシステム500はまた、バス502に結合された通信インターフェース518を含む。通信インターフェース518は、ローカルネットワーク522に接続されたネットワークリンク520への双方向データ通信結合を提供する。例えば、通信インターフェース518は、統合サービスデジタルネットワークカード、ケーブルモデム、衛星モデム、または対応するタイプの電話回線にデータ通信接続を提供するモデムであってもよい。別の例として、通信インターフェース518は、データ通信接続を互換性のあるLANに提供するためのローカルエリアネットワークカードであってもよい。また、無線リンクが実装されてもよい。そのような実装では、通信インターフェース518は、種々のタイプの情報を表すデジタルデータストリームを搬送する電気信号、電磁信号、または光信号を送受信する。
ネットワークリンク520は、典型的には、1つ以上のネットワークを介して他のデータデバイスへのデータ通信を提供する。例えば、ネットワークリンク520は、ローカルネットワーク522を介してホストコンピュータ524またはインターネットサービスプロバイダ526によって操作されるデータデバイスへの接続を提供することができる。次に、ISP 526は、現在一般に「インターネット」528と呼ばれている世界的なパケットデータ通信ネットワークを介してデータ通信サービスを提供する。ローカルネットワーク522およびインターネット528は両方とも、デジタルデータストリームを搬送する電気信号、電磁信号または光信号を使用する。種々のネットワークを介する信号およびネットワークリンク520上の信号、ならびにコンピュータシステム500との間でデジタルデータを搬送する通信インターフェース518を介する信号は、伝送媒体の例示的な形態である。
コンピュータシステム500は、ネットワーク、ネットワークリンク520および通信インターフェース518を介して、メッセージを送信し、プログラムコードを含むデータを受信することができる。インターネットの例では、サーバ530は、インターネット528、ISP 526、ローカルネットワーク522、および通信インターフェース518を介して、アプリケーションプログラムの要求されたコードを送信することができる。
受信されたコードは、それが受信されたときにプロセッサ504によって実行され、および/または後の実行のために記憶デバイス510、または他の不揮発性記憶デバイスに記憶される。
同等物、拡張、代替物及びその他
先述の明細では、実装ごとに異なる可能性のある多数の具体的詳細を参照して、本発明の実施形態を説明してきた。したがって、本発明のクレームされた実施態様の唯一かつ排他的な指標であって、本発明のクレームされた実施態様であることが出願人によって意図されているものは、この出願から当該クレームが発行された特定の形式のクレームのセットであり、その後の訂正を含む。当該クレームに含まれる用語について本契約に明示的に記載される定義は、当該クレームにおいて使用される用語の意味を支配するものとする。したがって、クレームに明示的に記載されていない限定、要素、特性、特徴、利点又は属性は、そのようなクレームの範囲を決して限定すべきではない。したがって、本明細書および図面は、制限的な意味ではなく例示的な意味に考えられるべきである。
本発明の種々の態様は、以下に列挙した実施例(EEE)から理解することができる:
EEE1
後方再整形マッピングテーブルを前方再整形マッピングテーブルの逆として初めに生成するステップであって、前記前方再整形テーブルは、第1のダイナミックレンジの前方再整形された画像を第2のダイナミックレンジのソース画像から生成するための前方再整形マッピングを生成するために使用され、前記第1のダイナミックレンジは前記第2のダイナミックレンジよりも低く、前記前方再整形マッピングテーブルは、前記第2のダイナミックレンジの前記サンプリングされた輝度コードワード、前記第2のダイナミックレンジのサンプリングされた色度コードワード、前記第2のダイナミックレンジの前記サンプリングされた輝度コードワードに対応する前記第1のダイナミックレンジのコンテンツマッピングされた輝度コードワード、及び前記第2のダイナミックレンジの前記サンプリングされた色度コードワードに対応する前記第1のダイナミックレンジのコンテンツマッピングされた色度コードワードを含む、ステップと、
前記コンテンツマッピングされた輝度コードワードを前方再整形された輝度コードワードで置き換えることによって前記後方再整形マッピングテーブルを更新するステップであって、前記前方再整形された輝度コードワードは、前記第2のダイナミックレンジの前記サンプリングされた輝度コードワードに輝度前方マッピングを適用することによって生成され、前記輝度前方マッピングは前記前方再整形マッピングテーブルから構築される、ステップと、
前記第1のダイナミックレンジの前記前方再整形された画像から前記第2のダイナミックレンジの再構成された画像を創るための後方再整形マッピングを生成するために前記後方再整形マッピングテーブルと前記輝度前方マッピングを使用するステップと、
前記前方再整形された画像を、前記後方再整形マッピングを指定する画像メタデータとともに、ビデオ信号中にエンコードするステップとを含む方法。
EEE2
前記ビデオ信号の受信デバイスは、前記後方再整形マッピングを前記前方再整形された画像に適用して、前記第2のダイナミックレンジの前記再構成された画像を創る、EEE1に記載の方法。
EEE3
エンドツーエンドのビデオ配信パイプラインで使用可能な計算リソースを決定するステップと、
前記使用可能な計算リソースを用いて、デコーダ側の前記第2のダイナミックレンジの前記再構成された画像の品質と、エンコーダ側の前記後方再整形マッピングを生成することの計算の複雑さとの間のトレードオフオプションの特定のセットを決定するステップと、
トレードオフオプションの前記特定のセットに従って画像処理操作の特定のセットを実行して、前記後方再整形マッピングを生成するステップとをさらに含む、EEE1又は2に記載の方法。
EEE4
表示画像を前記再構成された画像から導出させ、前記ビデオ信号の受信デバイスでレンダリングさせるステップをさらに含む、EEE2又は3に記載の方法。
EEE5
前記コンテンツマッピングされた色度コードを前方再整形された色度コードワードで置き換えることによって前記後方再整形マッピングテーブルを更新するステップであって、前記前方再整形された色度コードワードは、前記第2のダイナミックレンジの前記サンプリングされた輝度および色度コードワードに多変量重回帰(MMR)色度前方マッピングを適用することによって生成され、前記MMR色度前方マッピングは、前記前方再整形マッピングテーブルから構築される、ステップをさらに含む、EEE1~4のいずれか1つに記載の方法。
EEE6
前記サンプリングされた色度コードワードを不飽和化された色度コードワードで置き換えることによって、前記後方再整形マッピングテーブルを更新するステップをさらに含む、EEE1~5のいずれか1つに記載の方法。
EEE7
前記不飽和化された色度コードワードは、前記サンプリングされた色度コードワードに不飽和化関数を適用することによって生成され、前記不飽和化関数は、修正された輝度後方再整形マッピングと元の輝度後方再整形マッピングとの間の比として構築される、EEE6に記載の方法。
EEE8
前記再構成された画像のバンディングアーチファクトを低減するために、後方ルックアップテーブル修正を適用させるステップをさらに含む、EEE1~7のいずれか1つに記載の方法。
EEE9
前記後方マッピングテーブル及び前記前方マッピングテーブルのうちの少なくとも1つは、少なくとも部分的には前記ソース画像及び前記前方再整形された画像から動的に構築された三次元マッピングテーブル(3DMT)を表す、EEE1~8のいずれか1つに記載の方法。
EEE10
前記輝度前方マッピングは、輝度ルックアップテーブルによって表される、EEE1~9のいずれか1つに記載の方法。
EEE11
前記第2のダイナミックレンジの前記再構成された画像は、前記第2のダイナミックレンジの前記ソース画像を近似する、EEE1~10のいずれか1つに記載の方法。
EEE12
前記ビデオ信号は、単一層の後方互換ビデオ信号を表す、EEE1~11のいずれか1つに記載の方法。
EEE13
第1のダイナミックレンジの前方再整形された画像をビデオ信号からデコードするステップと、
後方再整形マッピングを含む画像メタデータを前記ビデオ信号からデコードするステップであって、前記後方再整形マッピングは、後方再整形マッピングテーブル及び輝度前方マッピングから上流画像処理デバイスによって生成されており、前記後方再整形マッピングテーブルは、前記輝度前方マッピングを生成する前方再整形マッピングテーブルの逆として前記上流画像処理デバイスによって初めに生成されており、前記後方再整形マッピングテーブル内のコンテンツマッピングされた輝度コードワードは、前方再整形された輝度コードワードで更新されており、前記前方再整形された輝度コードワードは、前記ソース画像におけるサンプリングされた輝度コードワードに前記輝度前方マッピングを適用することによって生成されたものである、ステップと、
前記前方再整形された画像に前記後方再整形マッピングを適用して前記再構成された画像を生成するステップと、
前記再構成された画像から導出される表示画像を表示デバイスでレンダリングさせるステップとを含む方法。
EEE14
EEE1~13に記載される方法のいずれか1つを実行するように構成されたコンピュータシステム。
EEE15
プロセッサを含み、EEE1~13に記載される方法のいずれか1つを実行するように構成された装置。
EEE16
EEE1~13に記載の方法のいずれかに従って1つ以上のプロセッサによって方法を実行するためのコンピュータ実行可能命令を記憶した非一時的なコンピュータ読取可能記憶媒体。

Claims (18)

  1. 後方再整形マッピングテーブルを前方再整形マッピングテーブルの逆として初めに生成するステップであって、前記前方再整形マッピングテーブルは、第1のダイナミックレンジの前方再整形された画像を第2のダイナミックレンジのソース画像から生成するための前方再整形マッピングを生成するために使用され、前記第1のダイナミックレンジは前記第2のダイナミックレンジよりも低く、前記前方再整形マッピングテーブルは、サンプルポイントの数の分だけ、前記第2のダイナミックレンジの輝度コードワード、前記第2のダイナミックレンジの色度コードワード、前記第2のダイナミックレンジの前記輝度コードワードに対応する前記第1のダイナミックレンジの輝度コードワード、及び前記第2のダイナミックレンジの前記色度コードワードに対応する前記第1のダイナミックレンジの色度コードワードを含み、前記サンプルポイントの数は、前記ソース画像内の画素の数と比較して低減される、ステップと、
    前記第1のダイナミックレンジの前記輝度コードワードを前方再整形された輝度コードワードで置き換えることによって前記後方再整形マッピングテーブルを更新するステップであって、前記前方再整形された輝度コードワードは、前記第2のダイナミックレンジの前記輝度コードワードに輝度前方マッピングを適用することによって生成され、前記輝度前方マッピングは前記前方再整形マッピングテーブルから構築される、ステップと、
    前記第1のダイナミックレンジの前記前方再整形された画像から前記第2のダイナミックレンジの再構成された画像を創るための後方再整形マッピングを生成するために前記後方再整形マッピングテーブルと前記輝度前方マッピングを使用するステップと、
    前記前方再整形された画像を、前記後方再整形マッピングを指定する画像メタデータとともに、ビデオ信号中にエンコードするステップとを含む方法。
  2. 前記輝度前方マッピングは、CDFマッチングで構築される、請求項1に記載の方法。
  3. エンドツーエンドのビデオ配信パイプラインで使用可能な計算リソースを決定するステップと、
    前記使用可能な計算リソースを用いて、デコーダ側の前記第2のダイナミックレンジの前記再構成された画像の品質と、エンコーダ側の前記後方再整形マッピングを生成することの計算の複雑さとの間のトレードオフオプションの特定のセットを決定するステップと、
    トレードオフオプションの前記特定のセットに従って画像処理操作の特定のセットを実行して、前記後方再整形マッピングを生成するステップとをさらに含む、請求項1又は2に記載の方法。
  4. 表示画像を前記再構成された画像から導出させ、前記ビデオ信号の受信デバイスでレンダリングさせるステップをさらに含む、請求項1~3のいずれか1項に記載の方法。
  5. 前記第1のダイナミックレンジの前記色度コードワードを前方再整形された色度コードワードで置き換えることによって前記後方再整形マッピングテーブルを更新するステップであって、前記前方再整形された色度コードワードは、前記第2のダイナミックレンジの前記輝度および色度コードワードに多変量重回帰(MMR)色度前方マッピングを適用することによって生成され、前記MMR色度前方マッピングは、前記前方再整形マッピングテーブルから構築される、ステップをさらに含む、請求項1~4のいずれか1項に記載の方法。
  6. 前記第2のダイナミックレンジの前記色度コードワードを不飽和化された色度コードワードで置き換えることによって、前記後方再整形マッピングテーブルを更新するステップをさらに含む、請求項1~5のいずれか1項に記載の方法。
  7. 前記不飽和化された色度コードワードは、前記第2のダイナミックレンジの前記色度コードワードに不飽和化関数を適用することによって生成され、前記不飽和化関数は、修正された輝度後方再整形マッピングと元の輝度後方再整形マッピングとの間の比として構築される、請求項6に記載の方法。
  8. 前記再構成された画像のバンディングアーチファクトを低減するために、後方ルックアップテーブル修正を適用させるステップをさらに含む、請求項1~7のいずれか1項に記載の方法。
  9. 前記後方マッピングテーブル及び前記前方マッピングテーブルのうちの少なくとも1つは、少なくとも部分的には前記ソース画像及び前記前方再整形された画像から動的に構築された三次元マッピングテーブル(3DMT)を表す、請求項1~8のいずれか1項に記載の方法。
  10. 前記輝度前方マッピングは、輝度ルックアップテーブルによって表される、請求項1~9のいずれか1項に記載の方法。
  11. 前記第2のダイナミックレンジの前記再構成された画像は、前記第2のダイナミックレンジの前記ソース画像を近似する、請求項1~10のいずれか1項に記載の方法。
  12. 前記ビデオ信号は、単一層の後方互換ビデオ信号を表す、請求項1~11のいずれか1項に記載の方法。
  13. 前記ビデオ信号の受信デバイスは、前記前方再整形された画像に前記後方再整形マッピングを適用して、前記第2のダイナミックレンジの前記再構成された画像を創る、請求項1~12のいずれか1項に記載の方法。
  14. 第1のダイナミックレンジの前方再整形された画像をビデオ信号からデコードするステップであって、前記前方再整形された画像は、前方再整形マッピングテーブルから生成される前方再整形マッピングによって第2のダイナミックレンジのソース画像から生成され、前記前方再整形マッピングテーブルは、サンプルポイントの数の分だけ、前記第2のダイナミックレンジの輝度コードワード、前記第2のダイナミックレンジの色度コードワード、前記第2のダイナミックレンジの前記輝度コードワードに対応する前記第1のダイナミックレンジの輝度コードワード、及び前記第2のダイナミックレンジの前記色度コードワードに対応する前記第1のダイナミックレンジの色度コードワードを含み、前記サンプルポイントの数は、前記ソース画像内の画素の数と比較して低減される、ステップと、
    後方再整形マッピングを含む画像メタデータを前記ビデオ信号からデコードするステップであって、前記後方再整形マッピングは、後方再整形マッピングテーブル及び前記前方再整形マッピングテーブルから構築された輝度前方マッピングから上流画像処理デバイスによって生成されており、前記後方再整形マッピングテーブルは、前記前方再整形マッピングテーブルの逆として前記上流画像処理デバイスによって初めに生成されており、前記後方再整形マッピングテーブル内のコンテンツマッピングされた輝度コードワードは、前方再整形された輝度コードワードで更新されており、前記前方再整形された輝度コードワードは、前記ソース画像における輝度コードワードに前記輝度前方マッピングを適用することによって生成されたものである、ステップと、
    前記前方再整形された画像に前記後方再整形マッピングを適用して再構成された画像を生成するステップと、
    前記再構成された画像から導出される表示画像を表示デバイスでレンダリングさせるステップとを含む方法。
  15. 請求項1~14に記載される方法のいずれか1つを実行するように構成されたコンピュータシステム。
  16. プロセッサを含み、請求項1~14に記載される方法のいずれか1つを実行するように構成された装置。
  17. 請求項1~14に記載の方法のいずれかに従って1つ以上のプロセッサによって方法を実行するためのコンピュータ実行可能命令を記憶した非一時的なコンピュータ読取可能記憶媒体。
  18. 請求項1~13のいずれか1項に記載の方法で生成された前記ビデオ信号を表すビットストリーム。
JP2022522878A 2019-10-17 2020-10-16 ビデオコーデックにおける品質と計算の複雑さとの間の調整可能なトレードオフ Active JP7439251B2 (ja)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201962916579P 2019-10-17 2019-10-17
EP19203773 2019-10-17
EP19203773.7 2019-10-17
US62/916,579 2019-10-17
PCT/US2020/055864 WO2021076822A1 (en) 2019-10-17 2020-10-16 Adjustable trade-off between quality and computation complexity in video codecs

Publications (2)

Publication Number Publication Date
JP2023501885A true JP2023501885A (ja) 2023-01-20
JP7439251B2 JP7439251B2 (ja) 2024-02-27

Family

ID=73043325

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2022522878A Active JP7439251B2 (ja) 2019-10-17 2020-10-16 ビデオコーデックにおける品質と計算の複雑さとの間の調整可能なトレードオフ

Country Status (5)

Country Link
US (1) US11818400B2 (ja)
EP (1) EP4046383A1 (ja)
JP (1) JP7439251B2 (ja)
CN (1) CN114556940A (ja)
WO (1) WO2021076822A1 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023177863A1 (en) 2022-03-18 2023-09-21 Dolby Laboratories Licensing Corporation Image optimization in mobile capture and editing applications
WO2023229898A1 (en) 2022-05-24 2023-11-30 Dolby Laboratories Licensing Corporation Neutral color preservation for single-layer backward compatible codec

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20180007356A1 (en) * 2016-06-29 2018-01-04 Dolby Laboratories Licensing Corporation Reshaping curve optimization in hdr coding
US20190110054A1 (en) * 2016-03-23 2019-04-11 Dolby Laboratories Licensing Corporation Encoding and Decoding Reversible Production-Quality Single-Layer Video Signals

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016153896A1 (en) 2015-03-20 2016-09-29 Dolby Laboratories Licensing Corporation Signal reshaping approximation
US10032262B2 (en) 2016-02-02 2018-07-24 Dolby Laboratories Licensing Corporation Block-based content-adaptive reshaping for high dynamic range images
US10575028B2 (en) 2016-09-09 2020-02-25 Dolby Laboratories Licensing Corporation Coding of high dynamic range video using segment-based reshaping
US10264287B2 (en) 2016-10-05 2019-04-16 Dolby Laboratories Licensing Corporation Inverse luma/chroma mappings with histogram transfer and approximation
CN110178374B (zh) * 2017-01-18 2023-10-10 杜比实验室特许公司 用于对高动态范围视频进行编码的基于段的整形
US11277627B2 (en) 2018-05-11 2022-03-15 Dolby Laboratories Licensing Corporation High-fidelity full reference and high-efficiency reduced reference encoding in end-to-end single-layer backward compatible encoding pipeline
US11277646B2 (en) 2018-10-03 2022-03-15 Dolby Laboratories Licensing Corporation Reducing banding artifacts in backward-compatible HDR imaging

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20190110054A1 (en) * 2016-03-23 2019-04-11 Dolby Laboratories Licensing Corporation Encoding and Decoding Reversible Production-Quality Single-Layer Video Signals
US20180007356A1 (en) * 2016-06-29 2018-01-04 Dolby Laboratories Licensing Corporation Reshaping curve optimization in hdr coding

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
PU, FANGJUN ET AL.: "CE12-4: SDR In-loop Reshaping", JOINT VIDEO EXPERTS TEAM (JVET) OF ITU-T SG 16 WP 3 AND ISO/IEC JTC 1/SC 29/WG 11 12TH MEETING: MACA, vol. JVET-L0246 (version 2), JPN6023030844, 4 October 2018 (2018-10-04), ISSN: 0005120103 *

Also Published As

Publication number Publication date
EP4046383A1 (en) 2022-08-24
WO2021076822A1 (en) 2021-04-22
US20230171436A1 (en) 2023-06-01
CN114556940A (zh) 2022-05-27
US11818400B2 (en) 2023-11-14
JP7439251B2 (ja) 2024-02-27

Similar Documents

Publication Publication Date Title
CN112106357B (zh) 用于对图像数据进行编码和解码的方法及装置
CN109416832B (zh) 高效的基于直方图的亮度外观匹配
US10264287B2 (en) Inverse luma/chroma mappings with histogram transfer and approximation
CN108885783B (zh) 编码和解码可逆制作质量单层视频信号
EP3734588B1 (en) Color appearance preservation in video codecs
KR102380164B1 (ko) 게이밍 및/또는 sdr+ 콘텐츠에 대한 자동 디스플레이 관리 메타데이터 생성
US10609424B2 (en) Single-layer progressive coding for supporting multi-capability HDR composition
US11388408B2 (en) Interpolation of reshaping functions
TWI812874B (zh) 張量乘積之b平滑曲線預測子
JP7439251B2 (ja) ビデオコーデックにおける品質と計算の複雑さとの間の調整可能なトレードオフ
US12003746B2 (en) Joint forward and backward neural network optimization in image processing
EP3306563B1 (en) Inverse luma/chroma mappings with histogram transfer and approximation
JP7434554B2 (ja) カスケード予測
JP2024522166A (ja) チェーンドリシェーピング関数の最適化

Legal Events

Date Code Title Description
A529 Written submission of copy of amendment under article 34 pct

Free format text: JAPANESE INTERMEDIATE CODE: A529

Effective date: 20220615

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20220615

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20230725

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20230801

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20231025

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20240116

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20240214

R150 Certificate of patent or registration of utility model

Ref document number: 7439251

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150