JP7299982B2 - 拡張標準ダイナミックレンジビデオ(sdr+)における機械学習ベースのダイナミックコンポージング - Google Patents
拡張標準ダイナミックレンジビデオ(sdr+)における機械学習ベースのダイナミックコンポージング Download PDFInfo
- Publication number
- JP7299982B2 JP7299982B2 JP2021532030A JP2021532030A JP7299982B2 JP 7299982 B2 JP7299982 B2 JP 7299982B2 JP 2021532030 A JP2021532030 A JP 2021532030A JP 2021532030 A JP2021532030 A JP 2021532030A JP 7299982 B2 JP7299982 B2 JP 7299982B2
- Authority
- JP
- Japan
- Prior art keywords
- image
- sdr
- training
- hdr
- backward
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000010801 machine learning Methods 0.000 title description 43
- 238000012549 training Methods 0.000 claims description 285
- 239000013598 vector Substances 0.000 claims description 130
- 241000023320 Luma <angiosperm> Species 0.000 claims description 120
- OSWPMRLSEDHDFF-UHFFFAOYSA-N methyl salicylate Chemical compound COC(=O)C1=CC=CC=C1O OSWPMRLSEDHDFF-UHFFFAOYSA-N 0.000 claims description 120
- 238000000034 method Methods 0.000 claims description 112
- 238000013507 mapping Methods 0.000 claims description 105
- 230000008569 process Effects 0.000 claims description 32
- 230000000007 visual effect Effects 0.000 claims description 26
- 230000033001 locomotion Effects 0.000 claims description 17
- 230000003068 static effect Effects 0.000 claims description 16
- 238000009877 rendering Methods 0.000 claims description 7
- 238000007493 shaping process Methods 0.000 claims description 6
- 238000004590 computer program Methods 0.000 claims 1
- 238000012360 testing method Methods 0.000 description 34
- 238000013459 approach Methods 0.000 description 22
- 238000003860 storage Methods 0.000 description 18
- 239000011159 matrix material Substances 0.000 description 17
- 238000004891 communication Methods 0.000 description 16
- 238000012546 transfer Methods 0.000 description 14
- 230000006870 function Effects 0.000 description 11
- 239000000284 extract Substances 0.000 description 8
- 230000003247 decreasing effect Effects 0.000 description 7
- 238000013139 quantization Methods 0.000 description 7
- 238000012935 Averaging Methods 0.000 description 6
- 230000004927 fusion Effects 0.000 description 6
- 230000003287 optical effect Effects 0.000 description 6
- 230000005540 biological transmission Effects 0.000 description 5
- 238000013500 data storage Methods 0.000 description 5
- 238000009826 distribution Methods 0.000 description 5
- 238000005457 optimization Methods 0.000 description 5
- 230000003044 adaptive effect Effects 0.000 description 4
- 238000007726 management method Methods 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- 238000011144 upstream manufacturing Methods 0.000 description 4
- 230000001419 dependent effect Effects 0.000 description 3
- 241001502919 Gambusia luma Species 0.000 description 2
- 230000006835 compression Effects 0.000 description 2
- 238000007906 compression Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000003064 k means clustering Methods 0.000 description 2
- 238000013138 pruning Methods 0.000 description 2
- 230000001172 regenerating effect Effects 0.000 description 2
- 239000002356 single layer Substances 0.000 description 2
- 239000007787 solid Substances 0.000 description 2
- RYGMFSIKBFXOCR-UHFFFAOYSA-N Copper Chemical compound [Cu] RYGMFSIKBFXOCR-UHFFFAOYSA-N 0.000 description 1
- 241000282412 Homo Species 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 230000006837 decompression Effects 0.000 description 1
- 238000011143 downstream manufacturing Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 230000004424 eye movement Effects 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 239000010410 layer Substances 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000008450 motivation Effects 0.000 description 1
- 230000006855 networking Effects 0.000 description 1
- 238000004321 preservation Methods 0.000 description 1
- 230000000644 propagated effect Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/90—Dynamic range modification of images or parts thereof
- G06T5/92—Dynamic range modification of images or parts thereof based on global image properties
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/80—Details of filtering operations specially adapted for video compression, e.g. for pixel interpolation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/90—Determination of colour characteristics
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/132—Sampling, masking or truncation of coding units, e.g. adaptive resampling, frame skipping, frame interpolation or high-frequency transform coefficient masking
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/162—User input
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
- H04N19/172—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/186—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a colour or a chrominance component
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/189—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding
- H04N19/196—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding being specially adapted for the computation of encoding parameters, e.g. by averaging previously computed encoding parameters
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/46—Embedding additional information in the video signal during the compression process
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/90—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
- H04N19/98—Adaptive-dynamic-range coding [ADRC]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20081—Training; Learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20172—Image enhancement details
- G06T2207/20208—High dynamic range [HDR] image processing
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Software Systems (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Computing Systems (AREA)
- Evolutionary Computation (AREA)
- Medical Informatics (AREA)
- Data Mining & Analysis (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Image Processing (AREA)
- Image Analysis (AREA)
Description
本出願は、2018年12月18日に出願された米国特許出願第62/781,185号および2018年12月18日に出願された欧州優先権出願第18213670.5号の優先権を主張するものであり、そのすべての内容が参照により本明細書に組み込まれている。
本明細書で説明する例示的な実施形態は、機械学習による画像メタデータ生成/最適化に関する。複数のトレーニングSDR画像および複数の対応するトレーニングHDR画像を含む複数のトレーニング画像ペアが受信される。複数のトレーニング画像ペアにおける各トレーニング画像ペアは、複数のトレーニングSDR画像におけるトレーニングSDR画像と、複数の対応するトレーニングHDR画像における対応するトレーニングHDR画像とを含む。トレーニングSDR画像とそのような各トレーニング画像ペアにおける対応するトレーニングHDR画像は、同じ視覚コンテンツを描写するが、異なる輝度ダイナミックレンジを持つ。複数のトレーニング画像特徴ベクトルは、複数のトレーニング画像ペアにおける複数のトレーニングSDR画像から抽出される。複数のトレーニング画像特徴ベクトル内のトレーニング画像特徴ベクトルは、複数のトレーニング画像ペアのそれぞれのトレーニング画像ペアのトレーニングSDR画像から抽出される。複数の対応するトレーニングHDR画像を用いて導出された複数のトレーニング画像特徴ベクトルおよびグラウンドトゥルースは、SDR画像をマッピングされたHDR画像に後方再整形するために使用される後方再整形マッピングの動作パラメータ値を予測するために、1つまたは複数の後方再整形メタデータ予測モデルをトレーニングするために使用される。
図1は、ビデオキャプチャ/生成からHDRまたはSDRディスプレイまでの様々なフェーズを示すビデオ配信パイプライン(100)の例示的なプロセスを示す。例示的なHDRディスプレイにはテレビ、モバイルデバイス、ホームシアター等と関連して動作する画像ディスプレイが含まれてもよいが、これらに限定されない。例示的なSDRディスプレイにはSDRテレビ、モバイルデバイス、ホームシアターディスプレイ、ヘッドマウントディスプレイデバイス、ウェアラブルディスプレイデバイスなどが含まれてもよいが、これらに限定されない。
単一層逆ディスプレイ管理(SLiDM)またはSDR+を使用して、HDRディスプレイデバイス上でのレンダリングのためのSDRコンテンツを強化することができる。SDR画像のルマチャネルおよびクロマチャネル(またはカラーコンポーネント)は、HDR画像の対応するルマチャネルおよびクロマチャネルを生成するために、画像メタデータを使用して別々にマッピングすることができる。
限定ではなく例として、SDRルマおよびクロマコードワードからのHDRルマおよびクロマコードワードの予測/推定は、GPRモデルおよびクロマディクショナリを使用して、図2Aに示されるようなプロセスフローにおいて実行され得る。
図2Bに示すようなGPRベースのプロセス(例えば、フローチャート、アプローチなど)を使用して、Q個の(例えば、分散、等距離、非等距離など)サンプル点を、入力SDRコンテンツ(例えば、単一のSDR画像、1つまたは複数のSDR画像、SDR画像のグループ、SDR画像のシーケンスを含むシーンのいくつかまたはすべて、など)に基づいて、後方整形曲線上で、予測または推定することができ、水平軸は、実際のSDR画像内のSDRルマコードワードまたは値を表すためのすべての利用可能なSDRコードワードまたは値を含むSDRコードワード空間を表し、垂直軸は、マッピングされたHDRコードワードまたは値を含むマッピングされたHDRコードワード空間を表す。次に、予測/推定サンプル点を補間および/または外挿して、後方再整形曲線(またはBLUT)全体を構築することができる。
特徴ベクトル行列Xおよび真の予測行列y内の観測値は、GPRモデルをトレーニングするために、またはその動作パラメータを以下のように学習するために使用することができる。
テストフェーズは、(テスト)SDR画像から、例えば、特徴ベクトルをトレーニングする際に使用される同じまたは同一の特徴タイプを用いて特徴ベクトルを構築(テスト)し、次いで、トレーニングされたGPRモデルを使用して、後方再整形曲線(または対応する後方LUT)においてサンプルを構築するために使用されてもよい。次に、これらのサンプルを補間および/または外挿して、後方整形曲線全体(またはBLUT全体)を生成することができる。CDFマッチングは、結果として生じるBLUTが滑らかで単調に減少しないことを保証するために、生成されたBLUTを用いて実行されることができる。
いくつかの動作シナリオでは、ルママッピング(またはルマ後方再整形)は、マッピングまたは再構成されたHDRビデオコンテンツの対応するルマチャネルの予測または推定のために、SDRビデオコンテンツの単一のルマチャネル(たとえば、「Y」など)を使用し、一方、クロママッピング(またはクロマ後方再整形)は、マッピングまたは再構成されたHDRビデオコンテンツのクロマチャネルの予測または推定のために、SDRビデオコンテンツの3つすべてのルマチャネルおよびクロマチャネル(たとえば、「Y」、「Cb」/「C0」および「Cr」/「C1」など)を使用する。追加的、任意選択的、または代替的に、クロママッピングは、事前トレーニングされたクロマディクショナリを使用して、クロマ予測プロセスとして実装または実行され得る。
クロマディクショナリアプローチのテストフェーズは、対応するHDR画像へのアクセスに依存せずに実行されてもよい。テストフェーズは、テストSDR画像上の特徴ベクトル(例えば、トレーニング特徴ベクトルなどで使用される同じまたは同一の特徴タイプを用いて)を計算し、特徴ベクトルをすべてのクラスタのすべてのクラスタ重心と比較して、最も近いクラスタ、または2つ以上の最も近いクラスタを見つけるために実施または実行することができる。最も近いクラスタまたは2つ以上の最も近いクラスタのA行列およびB行列を使用して、そのテストSDR画像についてのMMR係数を計算(例えば、2つ以上の最も近いクラスタが使用される場合に組み合わせるなど)または導出することができる。テストSDR画像について導出されたMMR係数は、例えばデコーダ側で、テストSDR画像からマッピングされたHDR画像のクロマチャネル内のHDRコードワードを再構成するために(例えばデコーダ等によって)使用され得る。
ルマおよびクロマ後方再整形マッピング(SDRルマおよびクロマコードワードからのHDRルマおよびクロマコードワードの予測/推定)を使用して、HDRルックを操作し、メタデータを最適化するための多種多様な異なる可能性を開く(またはサポートする)ことができる。
いくつかの動作シナリオでは、図2Fに示すように、異なるスタイル(例えば、青みがかった画像を好むスタイル、赤みがかった画像を好むスタイル、強いコントラストを好む第1のカラーリストのスタイル、よりソフトな画像を好む異なるカラーリストのスタイルなど)または異なるHDRルックを、ビデオ信号で搬送されるダイナミックコンポーザメタデータまたはSDR画像で符号化された符号化ビットストリームによって、上流のビデオエンコーダから下流のビデオデコーダに転送することができる。
エンコーダ側でのスタイル転送と同様に、本明細書で説明するようなスタイル転送の一部または全部を、デコーダ側で使用可能にし、実施し、または実行することができる。
図4Aは、本発明の一実施形態による例示的なプロセスフローを示す。いくつかの実施形態では、1つまたは複数のコンピューティングデバイスまたはコンポーネント(たとえば、符号化デバイス/モジュール、トランスコーディングデバイス/モジュール、復号デバイス/モジュール、逆トーンマッピングデバイス/モジュール、トーンマッピングデバイス/モジュール、メディアデバイス/モジュール、予測モデルおよび特徴選択システム、逆マッピング生成およびアプリケーションシステムなど)は、このプロセスフローを実行し得る。ブロック402において、画像メタデータ予測システムは、複数のトレーニングSDR画像および複数の対応するトレーニングHDR画像を含む複数のトレーニング画像ペアを受信する。複数のトレーニング画像ペアにおける各トレーニング画像ペアは、複数のトレーニングSDR画像におけるトレーニングSDR画像と、複数の対応するトレーニングHDR画像における対応するトレーニングHDR画像とを含む。そのような各トレーニング画像ペアにおけるトレーニングSDR画像と対応するトレーニングHDR画像とは、同じ視覚コンテンツを描写するが、異なる輝度ダイナミックレンジを持つ。
本発明の実施形態は、コンピュータシステム、電子回路およびコンポーネントで構成されたシステム、マイクロコントローラなどの集積回路(IC)デバイス、フィールドプログラマブルゲートアレイ(FPGA)、または別の構成可能またはプログラマブル論理デバイス(PLD)、離散時間またはデジタル信号プロセッサ(DSP)、特定用途向けIC(ASIC)、および/またはそのようなシステム、デバイス、またはコンポーネントのうちの1つまたは複数を含む装置で実装され得る。コンピュータおよび/またはICは、本明細書で説明されるような、ダイナミックレンジが強化された画像の適応知覚量子化に関する命令を実行、制御、または実行することができる。コンピュータおよび/またはICは、本明細書に記載される適応知覚量子化プロセスに関連する様々なパラメータまたは値のいずれかを計算してもよい。画像およびビデオの実施形態は、ハードウェア、ソフトウェア、ファームウェア、およびそれらの様々な組合せで実施することができる。
先述の明細では、実装ごとに異なる可能性のある多数の具体的詳細を参照して、本発明の実施形態を説明してきた。したがって、本発明が何であり、出願人によって本発明であることが意図されているのが何であるかの唯一の排他的な指標は、後続の補正を含む、そのような特許請求の範囲が発行される特定の形態で、本出願から発行される請求項のセットである。当該特許請求の範囲に含まれる用語に関して本明細書に明示的に記載される定義は、特許請求の範囲で使用される用語の意味を規定するものとする。したがって、特許請求の範囲に明示的に記載されていない限定、要素、特性、特徴、利点または属性は、当該特許請求の範囲の範囲を何らかの形で制限するものであってはならない。したがって、本明細書および図面は、制限的な意味ではなく例示的な意味に考えられるべきである。
本発明は、本発明のいくつかの部分の構造、特徴、および機能性を説明する以下の列挙された実施例(EEE)を含むが、これらに限定されない、本明細書に記載された形態のいずれかで具現化されてもよい。
EEE1.
複数のトレーニング標準ダイナミックレンジ(SDR)画像および複数の対応するトレーニング高ダイナミックレンジ(HDR)画像を含む複数のトレーニング画像ペアを受信することであって、前記複数のトレーニング画像ペアにおける各トレーニング画像ペアは、前記複数のトレーニングSDR画像におけるトレーニングSDR画像および前記複数の対応するトレーニングHDR画像における対応するトレーニングHDR画像を含み、各トレーニング画像ペアにおける前記トレーニングSDR画像および前記対応するトレーニングHDR画像は、同じ視覚的コンテンツを示すが、異なる輝度ダイナミックレンジを有する、受信することと、
前記複数のトレーニング画像ペアにおける複数のトレーニングSDR画像から複数のトレーニング画像特徴ベクトルを抽出することであって、前記複数のトレーニング画像特徴ベクトルにおけるトレーニング画像特徴ベクトルは、前記複数のトレーニング画像ペアにおけるそれぞれのトレーニング画像ペアにおけるトレーニングSDR画像から抽出される、抽出することと、
前記複数のトレーニング画像特徴ベクトルおよび前記複数の対応するトレーニングHDR画像で導出されたグラウンドトゥルースを使用して、SDR画像をマッピングされたHDR画像に後方再整形するために使用される後方再整形マッピングの動作パラメータ値を予測するために、1つまたは複数の後方再整形メタデータ予測モデルをトレーニングすることと、を含む方法。
EEE2.
前記1つまたは複数の後方再整形メタデータ予測モデルはガウス過程回帰(GPR)モデルを含む、EEE1記載の方法。
EEE3.
対応するマッピングされたHDR画像に後方再整形されるSDR画像を受け取ることと、
前記SDR画像から画像特徴ベクトルを抽出することと、
GPRモデルを適用して、前記SDR画像のSDRルマコードワードを、前記マッピングされたHDR画像のマッピングされたHDRルマコードワードに後方再整形するために使用される画像固有のルマ後方再整形曲線を指定する動作パラメータ値のセットを生成することと、をさらに含む、EEE2に記載の方法。
EEE4.
前記1つまたは複数の後方再整形メタデータ予測モデルは、多変量多重回帰(MMR)マッピング行列のセットを含む、EEE1~3のいずれか1つに記載の方法。
EEE5.
対応するマッピングされたHDR画像に後方再整形されるSDR画像を受信することと、
前記SDR画像からの画像特徴ベクトルを抽出することと、
前記MMRマッピング行列を適用して、前記SDR画像のSDRルマおよびクロマコードワードをマッピングされたHDR画像のマッピングされたHDRクロマコードワードにマッピングするために使用される画像固有のクロマ後方再整形マッピングを指定するMMR係数のセットを生成することと、をさらに含む、EEE4記載の方法。
前記画像特徴ベクトルは、ルマヒストグラムビンおよびクロマヒストグラムビンによって連結された1Dルマおよびクロマ結合ヒストグラムによって表される、EEE1~5のいずれかに記載の方法。
EEE7.
前記複数のトレーニング画像ペアは、前記複数のトレーニング画像特徴ベクトルの自動クラスタ化によって生成されたトレーニング画像特徴ベクトルの複数のクラスタに対応するトレーニング画像ペアの複数のクラスタに分割され、複数のクラスタ重心は、トレーニング画像特徴ベクトルの前記複数のクラスタについて計算され、
対応するマッピングされたHDR画像に後方再整形されるSDR画像を受信することと、
前記SDR画像から画像特徴ベクトルを抽出することと、
画像特徴空間内の前記画像特徴ベクトルに最も近い1つまたは複数のクラスタ重心を有するトレーニング画像特徴ベクトルの1つまたは複数のクラスタに対応するトレーニング画像ペアの1つまたは複数のクラスタを見つけることと、
トレーニング画像ペアの前記1つまたは複数のクラスタを介してトレーニングされた後方再整形メタデータ予測モデルの1つまたは複数のセットを使用して、前記SDR画像のSDRルマおよびクロマコードワードを前記マッピングされたHDR画像のマッピングされたHDRルマおよびクロマコードワードにマッピングするために使用される1つまたは複数の画像固有の後方再整形マッピングを決定することと、をさらに含む、EEE1~6のいずれか1つに記載の方法。
EEE8.
前記複数のトレーニング画像ペアは複数のトレーニングデータセットに対応し、前記複数のトレーニングデータセットは、トレーニングSDR画像の複数のセットと、対応するトレーニングHDR画像の複数のセットとを含み、前記複数のデータセット内の各トレーニングデータセットは、トレーニングSDR画像の前記複数のセット内のトレーニングSDR画像のセットと、トレーニングHDR画像の前記複数のセット内の対応するトレーニングHDR画像のセットとを含み、対応するトレーニングHDR画像の前記複数のセットは複数の異なるHDRルックを有し、対応するHDR画像の前記複数のセット内の対応するトレーニングHDR画像の各セットは、複数の異なるHDRルック内のそれぞれのHDRルックを有し、
対応するマッピングされたHDR画像に後方再整形されるSDR画像を受信することと、
前記SDR画像から画像特徴ベクトルを抽出することと、
複数のトレーニングデータセット内の特定のトレーニングデータセットを介してトレーニングされた後方再整形メタデータ予測モデルの特定のセットを使用して、前記SDR画像のSDRルマおよびクロマコードワードを前記マッピングされたHDR画像のマッピングされたHDRルマおよびクロマコードワードにマッピングするために使用される画像固有の後方再整形マッピングを決定することと、をさらに含む、EEE1~7のいずれか1つに記載の方法。
EEE9.
SDR画像とともに、画像メタデータとして、前記SDR画像をマッピングされたHDR画像に後方再整形するために使用される後方再整形マッピングの1つまたは複数の動作パラメータ値をビデオ信号に符号化することをさらに含み、前記ビデオ信号は1つまたは複数の受信デバイスに、前記マッピングされたHDR画像から導出された表示画像を1つまたは複数のディスプレイデバイスでレンダリングさせる、EEE1~8のいずれか1つに記載の方法
EEE10.
後方再整形マッピングの1つまたは複数の動作パラメータ値は、画像ごとのダイナミックコンポーザメタデータの符号化および復号をサポートする画像メタデータ符号化シンタックスに基づいてビデオ信号に符号化される、EEE1-9のいずれか1つに記載の方法。
後方再整形マッピングの動作パラメータ値を予測するための1つまたは複数の後方再整形メタデータ予測モデルは、複数のSDRルマコードワードから複数のマッピングされたHDRルマコードワードを予測するための複数のガウス過程回帰(GPR)モデルを含み、前記複数のGPRモードによって予測された複数のマッピングされたHDRルマコードワードは補間によって後方再整形曲線を構築するために使用され、前記後方再整形曲線は複数の2次多項式によって近似され、前記複数の2次多項式を指定する動作パラメータは、ダイナミックコンポーザメタデータとして1つまたは複数の受信者復号システムに提供される、EEE1~10のいずれかに記載の方法。
EEE12.
方法であって、
ビデオ信号から、対応するマッピングされた高ダイナミックレンジ(HDR)画像に後方再整形される標準ダイナミックレンジ(SDR)画像を復号することと、
前記ビデオ信号から、画像固有の後方再整形マッピングの1つまたは複数の動作パラメータ値を導出するために使用されるダイナミックコンポーザメタデータを復号することと、を含み、
画像固有の後方再整形マッピングの1つまたは複数の動作パラメータ値は、複数のトレーニング画像特徴ベクトルでトレーニングされた1つまたは複数の後方再整形メタデータ予測モデルによって予測され、
前記複数のトレーニング画像特徴ベクトルは、複数のトレーニング画像ペアにおける複数のトレーニングSDR画像から抽出され、
前記複数のトレーニング画像ペアは、複数のトレーニングSDR画像と複数の対応するトレーニングHDR画像とを含み、前記複数のトレーニング画像ペアにおける各トレーニング画像ペアは、前記複数のトレーニングSDR画像におけるトレーニングSDR画像と、前記複数の対応するトレーニングHDR画像における対応するトレーニングHDR画像とを含み、各そのようなトレーニング画像対における前記トレーニングSDR画像と前記対応するトレーニングHDR画像とは同じ視覚的コンテンツを示すが、異なる輝度ダイナミックレンジを有し、
前記方法は、さらに、
前記画像固有の後方再整形マッピングの1つまたは複数の動作パラメータ値を使用して、前記SDR画像を前記マッピングされたHDR画像に後方再整形することと、
前記マッピングされたHDR画像から導出された表示画像をディスプレイデバイスでレンダリングさせることと、を含む、方法。
EEE13.
前記画像固有の後方再整形マッピングの前記1つまたは複数の動作パラメータ値は、後方ルックアップテーブル(BLUT)に近似する二次多項式のセットを指定する多項式係数を含み、前記二次多項式のセットを使用して構築された前記BLUTは、前記SDR画像のSDRルマコードワードを、前記マッピングされたHDR画像のHDRルマコードワードに後方再整形するために使用される、EEE12に記載の方法。
EEE14.
前記画像固有の後方整形マッピングの前記1つまたは複数の動作パラメータ値は、1つまたは複数のMMRマッピング行列を指定する多変量多重回帰(MMR)係数を含み、前記MMR係数は、前記SDR画像のSDRルマおよびクロマコードワードを、前記マッピングされたHDR画像のHDRクロマコードワードにマッピングするために使用される、EEE12またはEEE13に記載の方法。
EEE15.
1つまたは複数のクラスタインデックスは前記SDR画像のための前記ビデオ信号から復号され、1つまたは複数のクラスタインデックスは、前記SDR画像に適用可能な、1つまたは複数のクロマディクショナリの中の特定のクロマディクショナリにおける1つまたは複数のクラスタを識別するために使用され、画像固有の多変量多重回帰(MMR)係数は、前記1つまたは複数のクラスタインデックスを通して識別された特定のクロマディクショナリの中の1つまたは複数のクロマ行列のセットから生成され、前記画像固有のMMR係数は、前記SDR画像のSDRルマおよびクロマコードワードを、マッピングされたHDR画像のHDRクロマコードワードにマッピングするために使用される、EEE12~14のいずれか1つに記載の方法。
前記1つまたは複数の後方再整形メタデータ予測モデルは、ガウス過程回帰(GPR)モデルを含む、EEE12~15のいずれか1つに記載の方法。
EEE17.
前記画像固有の後方再整形マッピングの前記1つまたは複数の動作パラメータ値は、画像固有の予測値を非画像固有のスタティック後方再整形マッピング値で補間することによって導出される少なくとも1つの値を含む、EEE12~16のいずれかに記載の方法。
EEE18.
前記SDR画像は、IPT PQ(ICtCp)色空間、YCbCr色空間、RGB色空間、Rec.2020色空間、Rec.709色空間、拡張ダイナミックレンジ(EDR)色空間、ガンマ/HLG/PQ色空間、または標準ダイナミックレンジ(SDR)色空間のうちの1つで表される、EEE12~17のいずれか1つに記載の方法。
EEE19.
EEE1~18に記載の方法のいずれか1つを実行するように構成された、コンピュータシステム。
EEE20.
プロセッサを含み、EEE1~18に記載の方法のいずれか1つを実行するように構成された、装置。
EEE21.
EEE1~18に記載のいずれか1つの方法による方法を実行するためのコンピュータ実行可能命令を記憶した、非一時的コンピュータ読み取り可能な記憶媒体。
Claims (15)
- 複数のトレーニング標準ダイナミックレンジ(SDR)画像および複数の対応するトレーニング高ダイナミックレンジ(HDR)画像を含む複数のトレーニング画像ペアを受信することであって、前記複数のトレーニング画像ペアにおける各トレーニング画像ペアは、前記複数のトレーニングSDR画像におけるトレーニングSDR画像および前記複数の対応するトレーニングHDR画像における対応するトレーニングHDR画像を含み、各トレーニング画像ペアにおける前記トレーニングSDR画像および前記対応するトレーニングHDR画像は、同じ視覚的コンテンツを示すが、異なる輝度ダイナミックレンジを有する、受信することと、
前記複数のトレーニング画像ペアにおける複数のトレーニングSDR画像から複数のトレーニング画像特徴ベクトルを抽出することであって、前記複数のトレーニング画像特徴ベクトルにおけるトレーニング画像特徴ベクトルは、前記複数のトレーニング画像ペアにおけるそれぞれのトレーニング画像ペアにおけるトレーニングSDR画像から抽出される、抽出することと、
前記複数のトレーニング画像特徴ベクトルおよび前記複数の対応するトレーニングHDR画像で導出されたグラウンドトゥルースを使用して、SDR画像をマッピングされたHDR画像に後方再整形するために使用される後方再整形マッピングの動作パラメータ値を予測するために、1つまたは複数の後方再整形メタデータ予測モデルをトレーニングすることと、
対応するマッピングされたHDR画像に後方再整形されるSDR画像を受け取ることと、
前記受け取ったSDR画像から画像特徴ベクトルを抽出することと、
前記1つまたは複数の後方再整形メタデータ予測モデルを適用して、前記マッピングされたHDR画像のマッピングされたHDRルマコードワードに前記受け取ったSDR画像のSDRルマコードワードを後方再整形するために使用される画像固有のルマ後方再整形曲線を指定する動作パラメータ値のセットを生成することと、を含む、方法。 - 前記1つまたは複数の後方再整形メタデータ予測モデルはガウス過程回帰(GPR)モデルを含む、方法であって、
GPRモデルを適用して、前記SDR画像のSDRルマコードワードを、前記マッピングされたHDR画像のマッピングされたHDRルマコードワードに後方再整形するために使用される画像固有のルマ後方再整形曲線を指定する動作パラメータ値のセットを生成することと、をさらに含む、請求項1に記載の方法。 - 前記1つまたは複数の後方再整形メタデータ予測モデルは、多変量多重回帰(MMR)マッピング行列のセットを含む、請求項1または2に記載の方法。
- 前記画像特徴ベクトルは、ルマヒストグラムビンおよびクロマヒストグラムビンによって連結された1Dルマおよびクロマ結合ヒストグラムによって表される、請求項1~3のいずれか一項に記載の方法。
- 前記複数のトレーニング画像ペアは、前記複数のトレーニング画像特徴ベクトルの自動クラスタ化によって生成されたトレーニング画像特徴ベクトルの複数のクラスタに対応するトレーニング画像ペアの複数のクラスタに分割され、複数のクラスタ重心は、トレーニング画像特徴ベクトルの前記複数のクラスタについて計算され、
対応するマッピングされたHDR画像に後方再整形されるSDR画像を受信することと、
前記SDR画像から画像特徴ベクトルを抽出することと、
画像特徴空間内の前記画像特徴ベクトルに最も近い1つまたは複数のクラスタ重心を有するトレーニング画像特徴ベクトルの1つまたは複数のクラスタに対応するトレーニング画像ペアの1つまたは複数のクラスタを見つけることと、
トレーニング画像ペアの前記1つまたは複数のクラスタを介してトレーニングされた後方再整形メタデータ予測モデルの1つまたは複数のセットを使用して、前記SDR画像のSDRルマおよびクロマコードワードを前記マッピングされたHDR画像のマッピングされたHDRルマおよびクロマコードワードにマッピングするために使用される1つまたは複数の画像固有の後方再整形マッピングを決定することと、をさらに含む、請求項1~4のいずれか一項に記載の方法。 - 前記複数のトレーニング画像ペアは複数のトレーニングデータセットに対応し、前記複数のトレーニングデータセットは、トレーニングSDR画像の複数のセットと、対応するトレーニングHDR画像の複数のセットとを含み、前記複数のデータセット内の各トレーニングデータセットは、トレーニングSDR画像の前記複数のセット内のトレーニングSDR画像のセットと、トレーニングHDR画像の前記複数のセット内の対応するトレーニングHDR画像のセットとを含み、対応するトレーニングHDR画像の前記複数のセットは複数の異なるHDRルックを有し、対応するHDR画像の前記複数のセット内の対応するトレーニングHDR画像の各セットは、複数の異なるHDRルック内のそれぞれのHDRルックを有し、
対応するマッピングされたHDR画像に後方再整形されるSDR画像を受信することと、
前記SDR画像から画像特徴ベクトルを抽出することと、
複数のトレーニングデータセット内の特定のトレーニングデータセットを介してトレーニングされた後方再整形メタデータ予測モデルの特定のセットを使用して、前記SDR画像のSDRルマおよびクロマコードワードを前記マッピングされたHDR画像のマッピングされたHDRルマおよびクロマコードワードにマッピングするために使用される画像固有の後方再整形マッピングを決定することと、をさらに含む、請求項1から5のいずれか一項に記載の方法。 - 後方再整形マッピングの1つまたは複数の動作パラメータ値は、画像ごとのダイナミックコンポーザメタデータの符号化および復号をサポートする画像メタデータ符号化シンタックスに基づいてビデオ信号に符号化される、請求項1~6のいずれか一項に記載の方法。
- 後方再整形マッピングの動作パラメータ値を予測するための1つまたは複数の後方再整形メタデータ予測モデルは、複数のSDRルマコードワードから複数のマッピングされたHDRルマコードワードを予測するための複数のガウス過程回帰(GPR)モデルを含み、前記複数のGPRモデルによって予測された複数のマッピングされたHDRルマコードワードは補間によって後方再整形曲線を構築するために使用され、前記後方再整形曲線は複数の2次多項式によって近似され、前記複数の2次多項式を指定する動作パラメータは、ダイナミックコンポーザメタデータとして1つまたは複数の受信者復号システムに提供される、請求項1~7のいずれか一項に記載の方法。
- 方法であって、
ビデオ信号から、対応するマッピングされた高ダイナミックレンジ(HDR)画像に後方再整形される標準ダイナミックレンジ(SDR)画像を復号することと、
前記ビデオ信号から、画像固有の後方再整形マッピングの1つまたは複数の動作パラメータ値を導出するために使用されるダイナミックコンポーザメタデータを復号することと、
前記画像固有の後方再整形マッピングの1つまたは複数の動作パラメータ値を使用して、前記SDR画像を前記マッピングされたHDR画像に後方再整形することと、
前記マッピングされたHDR画像から導出された表示画像をディスプレイデバイスでレンダリングさせることと、をさらに含む、請求項1から8のいずれか一項に記載の方法。 - 前記画像固有の後方再整形マッピングの前記1つまたは複数の動作パラメータ値は、後方ルックアップテーブル(BLUT)に近似する二次多項式のセットを指定する多項式係数を含み、前記二次多項式のセットを使用して構築された前記BLUTは、前記SDR画像のSDRルマコードワードを、前記マッピングされたHDR画像のHDRルマコードワードに後方再整形するために使用される、請求項9に記載の方法。
- 前記画像固有の後方整形マッピングの前記1つまたは複数の動作パラメータ値は、1つまたは複数のMMRマッピング行列を指定する多変量多重回帰(MMR)係数を含み、前記MMR係数は、前記SDR画像のSDRルマおよびクロマコードワードを、前記マッピングされたHDR画像のHDRクロマコードワードにマッピングするために使用される、請求項9または10に記載の方法。
- 前記画像固有の後方再整形マッピングの前記1つまたは複数の動作パラメータ値は、画像固有の予測値および非画像固有のスタティック後方再整形マッピング値の両方に依存する関数によって導出される少なくとも1つの値を含む、請求項9~11のいずれか一項に記載の方法。
- 請求項1~12のいずれか一項に記載の方法を実行するように構成された、コンピュータシステム。
- プロセッサを含み、請求項1~12のいずれか一項に記載の方法を実行するように構成された、装置。
- コンピューティングデバイスまたはシステムによって実行されると、前記コンピューティングデバイスまたはシステムに、請求項1~12のいずれか一項に記載の方法を実行させる命令を有する、コンピュータプログラム。
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201862781185P | 2018-12-18 | 2018-12-18 | |
EP18213670 | 2018-12-18 | ||
US62/781,185 | 2018-12-18 | ||
EP18213670.5 | 2018-12-18 | ||
PCT/US2019/066595 WO2020131731A1 (en) | 2018-12-18 | 2019-12-16 | Machine learning based dynamic composing in enhanced standard dynamic range video (sdr+) |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2022511072A JP2022511072A (ja) | 2022-01-28 |
JP7299982B2 true JP7299982B2 (ja) | 2023-06-28 |
Family
ID=69173423
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021532030A Active JP7299982B2 (ja) | 2018-12-18 | 2019-12-16 | 拡張標準ダイナミックレンジビデオ(sdr+)における機械学習ベースのダイナミックコンポージング |
Country Status (5)
Country | Link |
---|---|
US (1) | US12086969B2 (ja) |
EP (1) | EP3900341A1 (ja) |
JP (1) | JP7299982B2 (ja) |
CN (1) | CN113228660B (ja) |
WO (1) | WO2020131731A1 (ja) |
Families Citing this family (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP3853810B1 (en) * | 2018-09-19 | 2023-10-25 | Dolby Laboratories Licensing Corporation | Automatic display management metadata generation for gaming and/or sdr+ contents |
WO2020132371A1 (en) * | 2018-12-20 | 2020-06-25 | Warner Bros. Entertainment Inc. | Profile-based standard dynamic range and high dynamic range content generation |
US20220301124A1 (en) * | 2019-08-15 | 2022-09-22 | Dolby Laboratories Licensing Corporation | Efficient user-defined sdr-to-hdr conversion with model templates |
TWI812874B (zh) | 2019-10-01 | 2023-08-21 | 美商杜拜研究特許公司 | 張量乘積之b平滑曲線預測子 |
KR20220053102A (ko) * | 2020-10-21 | 2022-04-29 | 삼성디스플레이 주식회사 | 하이 다이내믹 레인지 후-처리 장치, 및 이를 포함하는 표시 장치 |
CN115529834A (zh) * | 2021-04-27 | 2022-12-27 | 京东方科技集团股份有限公司 | 图像处理方法和图像处理装置 |
US11544826B2 (en) * | 2021-04-30 | 2023-01-03 | Realnetworks, Inc. | Intelligent metadata service for video enhancement |
US11756173B2 (en) * | 2021-04-30 | 2023-09-12 | Realnetworks Llc | Real-time video enhancement and metadata sharing |
JP2024527025A (ja) * | 2021-07-29 | 2024-07-19 | ドルビー ラボラトリーズ ライセンシング コーポレイション | 画像のダイナミックレンジ変換及び表示管理のためのニューラルネットワーク |
US20230186435A1 (en) * | 2021-12-14 | 2023-06-15 | Netflix, Inc. | Techniques for component-based image preprocessing |
CN114422718B (zh) * | 2022-01-19 | 2022-12-13 | 北京百度网讯科技有限公司 | 一种视频转换方法、装置、电子设备及存储介质 |
WO2023178648A1 (zh) * | 2022-03-25 | 2023-09-28 | 京东方科技集团股份有限公司 | 视频处理方法及装置、电子设备、计算机可读存储介质 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20180098094A1 (en) | 2016-10-05 | 2018-04-05 | Dolby Laboratories Licensing Corporation | Inverse luma/chroma mappings with histogram transfer and approximation |
Family Cites Families (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20130107956A1 (en) * | 2010-07-06 | 2013-05-02 | Koninklijke Philips Electronics N.V. | Generation of high dynamic range images from low dynamic range images |
WO2012142471A1 (en) | 2011-04-14 | 2012-10-18 | Dolby Laboratories Licensing Corporation | Multiple color channel multiple regression predictor |
CN103747189A (zh) | 2013-11-27 | 2014-04-23 | 杨新锋 | 一种数字图像处理方法 |
EP2927865A1 (en) * | 2014-04-01 | 2015-10-07 | Thomson Licensing | Method and apparatus for encoding and decoding HDR images |
EP3272123B1 (en) | 2015-03-20 | 2019-06-19 | Dolby Laboratories Licensing Corporation | Signal reshaping approximation |
EP3510772B1 (en) | 2016-09-09 | 2020-12-09 | Dolby Laboratories Licensing Corporation | Coding of high dynamic range video using segment-based reshaping |
EP3306563B1 (en) | 2016-10-05 | 2022-01-12 | Dolby Laboratories Licensing Corporation | Inverse luma/chroma mappings with histogram transfer and approximation |
CN107995497B (zh) * | 2016-10-26 | 2021-05-28 | 杜比实验室特许公司 | 高动态范围视频的屏幕自适应解码 |
US10402952B2 (en) * | 2017-06-02 | 2019-09-03 | Apple Inc. | Perceptual tone mapping of SDR images for an HDR display |
JP6952202B2 (ja) | 2018-02-28 | 2021-10-20 | ドルビー ラボラトリーズ ライセンシング コーポレイション | 画像/映像処理のためのリニアエンコーダ |
CN108681991A (zh) | 2018-04-04 | 2018-10-19 | 上海交通大学 | 基于生成对抗网络的高动态范围反色调映射方法及系统 |
EP3853810B1 (en) | 2018-09-19 | 2023-10-25 | Dolby Laboratories Licensing Corporation | Automatic display management metadata generation for gaming and/or sdr+ contents |
-
2019
- 2019-12-16 US US17/415,650 patent/US12086969B2/en active Active
- 2019-12-16 EP EP19839021.3A patent/EP3900341A1/en active Pending
- 2019-12-16 CN CN201980084720.1A patent/CN113228660B/zh active Active
- 2019-12-16 JP JP2021532030A patent/JP7299982B2/ja active Active
- 2019-12-16 WO PCT/US2019/066595 patent/WO2020131731A1/en unknown
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20180098094A1 (en) | 2016-10-05 | 2018-04-05 | Dolby Laboratories Licensing Corporation | Inverse luma/chroma mappings with histogram transfer and approximation |
Non-Patent Citations (1)
Title |
---|
Gonzalo Luzardo, et al.,Fully-automatic inverse tone mapping preserving the content creator's artistic intentions,2018 Picture Coding Symposium(PCS),IEEE,2018年06月24日,pp.199-203 |
Also Published As
Publication number | Publication date |
---|---|
EP3900341A1 (en) | 2021-10-27 |
CN113228660B (zh) | 2023-12-12 |
WO2020131731A1 (en) | 2020-06-25 |
CN113228660A (zh) | 2021-08-06 |
JP2022511072A (ja) | 2022-01-28 |
US20220058783A1 (en) | 2022-02-24 |
US12086969B2 (en) | 2024-09-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7299982B2 (ja) | 拡張標準ダイナミックレンジビデオ(sdr+)における機械学習ベースのダイナミックコンポージング | |
US10659749B2 (en) | Efficient histogram-based luma look matching | |
US10264287B2 (en) | Inverse luma/chroma mappings with histogram transfer and approximation | |
US10701375B2 (en) | Encoding and decoding reversible production-quality single-layer video signals | |
JP7189230B2 (ja) | ニューラルネットワークマッピングを用いるhdr画像表現 | |
US10575028B2 (en) | Coding of high dynamic range video using segment-based reshaping | |
US10311558B2 (en) | Efficient image processing on content-adaptive PQ signal domain | |
US11430095B2 (en) | Automatic display management metadata generation for gaming and/or SDR+ contents | |
EP3734588B1 (en) | Color appearance preservation in video codecs | |
JP2021518725A (ja) | エンドツーエンド単一レイヤの下位互換性のある符号化パイプラインにおける、高忠実度の完全参照及び低減参照符号化 | |
WO2018231968A1 (en) | Efficient end-to-end single layer inverse display management coding | |
TWI812874B (zh) | 張量乘積之b平滑曲線預測子 | |
EP3306563B1 (en) | Inverse luma/chroma mappings with histogram transfer and approximation | |
US12003746B2 (en) | Joint forward and backward neural network optimization in image processing | |
JP7037584B2 (ja) | 効率的なエンド・ツー・エンドシングルレイヤー逆ディスプレイマネジメント符号化 | |
JP7439251B2 (ja) | ビデオコーデックにおける品質と計算の複雑さとの間の調整可能なトレードオフ | |
WO2021030506A1 (en) | Efficient user-defined sdr-to-hdr conversion with model templates |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20210802 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20221101 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230126 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20230523 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20230616 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7299982 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |