JP7309081B2 - Hdrイメージングにおけるブラインド局所再整形 - Google Patents
Hdrイメージングにおけるブラインド局所再整形 Download PDFInfo
- Publication number
- JP7309081B2 JP7309081B2 JP2022560080A JP2022560080A JP7309081B2 JP 7309081 B2 JP7309081 B2 JP 7309081B2 JP 2022560080 A JP2022560080 A JP 2022560080A JP 2022560080 A JP2022560080 A JP 2022560080A JP 7309081 B2 JP7309081 B2 JP 7309081B2
- Authority
- JP
- Japan
- Prior art keywords
- function
- reshaping
- array
- local
- image
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000003384 imaging method Methods 0.000 title 1
- 230000006870 function Effects 0.000 claims description 224
- 238000000034 method Methods 0.000 claims description 40
- 238000013507 mapping Methods 0.000 claims description 32
- 238000012804 iterative process Methods 0.000 claims description 6
- 238000007493 shaping process Methods 0.000 claims description 3
- 238000012360 testing method Methods 0.000 claims description 3
- 230000008707 rearrangement Effects 0.000 claims 1
- 230000008569 process Effects 0.000 description 13
- 239000002356 single layer Substances 0.000 description 10
- 241000023320 Luma <angiosperm> Species 0.000 description 9
- OSWPMRLSEDHDFF-UHFFFAOYSA-N methyl salicylate Chemical compound COC(=O)C1=CC=CC=C1O OSWPMRLSEDHDFF-UHFFFAOYSA-N 0.000 description 9
- 238000013459 approach Methods 0.000 description 6
- 230000006835 compression Effects 0.000 description 6
- 238000007906 compression Methods 0.000 description 6
- 238000013139 quantization Methods 0.000 description 4
- 230000000007 visual effect Effects 0.000 description 4
- 238000004422 calculation algorithm Methods 0.000 description 3
- 238000013500 data storage Methods 0.000 description 3
- 230000006837 decompression Effects 0.000 description 3
- 230000003044 adaptive effect Effects 0.000 description 2
- 238000003491 array Methods 0.000 description 2
- 239000003086 colorant Substances 0.000 description 2
- 238000009826 distribution Methods 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 239000010410 layer Substances 0.000 description 2
- 238000007726 management method Methods 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 230000002441 reversible effect Effects 0.000 description 2
- 230000000153 supplemental effect Effects 0.000 description 2
- 238000011144 upstream manufacturing Methods 0.000 description 2
- 241001502919 Gambusia luma Species 0.000 description 1
- 241000282412 Homo Species 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000009795 derivation Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000004424 eye movement Effects 0.000 description 1
- 238000007667 floating Methods 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000009877 rendering Methods 0.000 description 1
- 229920006395 saturated elastomer Polymers 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 238000000844 transformation Methods 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/117—Filters, e.g. for pre-processing or post-processing
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N23/00—Cameras or camera modules comprising electronic image sensors; Control thereof
- H04N23/70—Circuitry for compensating brightness variation in the scene
- H04N23/741—Circuitry for compensating brightness variation in the scene by increasing the dynamic range of the image compared to the dynamic range of the electronic image sensors
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/20—Image enhancement or restoration using local operators
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/90—Dynamic range modification of images or parts thereof
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/60—Extraction of image or video features relating to illumination properties, e.g. using a reflectance or lighting model
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/154—Measured or subjectively estimated visual quality after decoding, e.g. measurement of distortion
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
- H04N19/172—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/182—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a pixel
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/189—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding
- H04N19/192—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding the adaptation method, adaptation tool or adaptation type being iterative or recursive
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/80—Details of filtering operations specially adapted for video compression, e.g. for pixel interpolation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/85—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20172—Image enhancement details
- G06T2207/20208—High dynamic range [HDR] image processing
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/186—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a colour or a chrominance component
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/90—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
- H04N19/98—Adaptive-dynamic-range coding [ADRC]
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Software Systems (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Image Processing (AREA)
Description
本願は、2020年4月3日に出願された米国仮出願第63/004,609号および欧州特許出願第20167908.1号の優先権を主張するものであり、各出願は、その全体が参照により援用される。
本開示は、概括的には画像に関する。より詳細には、本発明のある実施形態は、局所再整形関数を用いて標準ダイナミックレンジ(SDR)画像から再構成された高ダイナミックレンジ(HDR)画像の符号化効率および画像品質を改善することに関する。
HDR画像およびビデオ・コンテンツを符号化するためのブラインド局所再整形のための方法が本稿に記載される。以下の記述では、説明の目的で、本発明の十全な理解を提供するために、多数の個別的な詳細が記載される。しかしながら、本発明は、これらの個別的な詳細なしに実施されうることは明らかであろう。他方では、本発明を不必要に隠蔽し、不明瞭にし、または埋没させることを避けるために、周知の構造および装置は、網羅的な詳細さでは記述されていない。
本明細書に記載される例示的実施形態は、HDR画像の符号化のためのブラインド局所再整形に関する。ある実施形態では、エンコーダにおいては、入力HDR画像が与えられて、エンコーダは、前方再整形関数のファミリーと前方マッピング・インデックス(forward mapping indices、FMI)のアレイを使用する。ここで、FMIアレイは、入力HDR画像を再整形し、再整形されたSDR画像を生成するために、各入力HDRピクセルについてどの前方再整形関数が使用されるべきかを示す。デコーダにおいては、受信された再整形SDR画像と後方再整形関数のファミリーが与えられて、デコーダは、逐次反復技法を適用して、後方マッピング・インデックス(backward mapping indices、BMI)のアレイを生成し、ここでBMIアレイは、入力HDR画像を最もよく近似する再構成HDR画像を生成するために、各SDRピクセルについてどの後方再整形関数が使用されるべきかを示す。
前記BMIアレイに従って入力再整形画像に局所後方再整形関数の集合を適用することによって前記第2のダイナミックレンジにおける第1の再構成された画像を生成する(310)段階と;
前記第1の再構成された画像およびFMI生成関数に基づいて前方マッピング・インデックス(forward mapping indices、FMI)の第1のアレイを生成する段階(315)であって、前記FMIアレイの各要素は、2つ以上の局所前方再整形関数の集合における局所前方再整形関数のインデックスを示し、局所前方再整形関数は、前記第2のダイナミックレンジからのピクセル値を前記第1のダイナミックレンジにおけるピクセル値にマッピングする、段階と;
第1の誤差メトリックに従って前記BMIアレイと前記第1のFMIアレイとの間の差を測定して、マッピング・インデックス誤差を生成する段階と;
前記マッピング・インデックス誤差に基づいて、更新されたBMIアレイを生成する段階(325)と;
前記更新されたBMIアレイに従って前記入力再整形画像に局所後方再整形関数の前記集合を適用することによって、前記第2のダイナミックレンジにおける第2の再構成された画像を生成する段階(330)と;
前記第2の再構成された画像および前記FMI生成関数に基づいて、更新されたFMIアレイを生成する段階(335)と;
前記更新されたFMIアレイに従って前記第2の再構成された画像に局所前方再整形関数の前記集合を適用することによって前記第1のダイナミックレンジにおける推定再整形画像を生成する段階(340)と;
第2の誤差メトリックに従って前記推定再整形画像と前記入力再整形画像との差を測定して、再整形画像誤差を生成する段階と;
前記再整形画像誤差と前記マッピング・インデックス誤差の組み合わせが収束基準を満たすかどうかを試験する段階であって:
前記収束基準が満たされている場合、逐次反復を終了し、前記第2の再構成された画像を前記出力再構成画像として出力し;
そうでない場合:
前記更新されたBMIアレイの要素および前記再整形画像誤差に基づいて、前記BMIアレイの要素を置換し(360);
もう一つの反復工程を実行する、段階とを含む。
前記大域的前方再整形関数のための属性値を生成する段階であって、前記属性値は、前記第2のダイナミックレンジにおける前記関数の非平坦領域(xレンジ)、前記xレンジの中点、および前記第2のダイナミックレンジにおける暗部およびハイライトのための平坦領域のうちの一つまたは複数を含む、段階と;
前記大域的前方再整形関数、前記属性値、およびxレンジ・スケーリング因子に基づいてテンプレート前方再整形関数を生成する段階と;
前記テンプレート前方再整形関数の逆関数を計算することによってテンプレート後方再整形関数を生成し;前記第2のダイナミックレンジにおけるターゲット輝度値に関連する局所前方再整形関数については、前記テンプレート前方再整形関数をx軸シフト値だけシフトすることによって前記局所前方再整形関数を生成し、前記x軸シフト値は、前記ターゲット輝度値については、前記局所前方再整形関数および前記テンプレート前方再整形関数を用いた対応する平均再整形出力値がほぼ等しくなるように決定される。
参照によりその全体が本明細書に組み込まれる、'262と称される特許文献1に記載されているように、図1Aおよび図1Bは、画像再整形を使用する例示的な単一層後方互換コーデック・フレームワークを示す。より具体的には、図1Aは、上流のビデオ・エンコーダ内の一つまたは複数のコンピューティング・プロセッサで実装されうる、例示的なエンコーダ側のコーデック・アーキテクチャーを示す。図1Bは、一つまたは複数の下流のビデオ・デコーダ内の一つまたは複数のコンピューティング・プロセッサで実装されうる、例示的なデコーダ側のコーデック・アーキテクチャーを示す。
図1Aおよび図1Bに描かれるシステムに基づく実施形態は、フレーム内のすべてのピクセルを再マッピングするために同じ前方再整形関数が使用されるので、「大域的再整形」を使用していると考えられてもよい。図2Aは、エンコーダが複数の前方再整形関数を適用でき、各関数が局所的な画像特性に従って選択される「局所再整形」の実施形態の一例を示している。
入力参照HDR(120)シーケンスが与えられた場合、そのビット深さをBvと表すことにする。対応する再整形されたSDRシーケンス(134)のビット深さをBsと表すことにする。vt,iが、入力参照HDR信号のt番目のフレームのi番目のピクセルを表すものとする。ある実施形態では、t番目のフレーム内のすべてのP個のピクセルを、Vtと表されるアレイとして集めることができる。
F<l>()=B<l> -1() l=0,…,L-1 (1)
B<l>()=F<l> -1() l=0,…,L-1
図2Aに描かれるように、エンコーダでは、Mtを与えられて、ブロック215で、再整形されたSDR信号(134)は、次のように生成される。
G()=G2(G1()) (4)
と表されてもよい。
たとえば、第1の演算子G1()は、ガウスぼかし演算子であってもよく、それは、入力HDR画像に適用されたとき、ぼかされたピクセル値
局所的後方再整形の目標は、もとの参照HDR画像(120)を可能な限り近似する再構成されたHDR画像(160)を生成することである。再構成プロセスにおいて、たとえば図2Bに示されるように、それぞれ対応するインデックスmt,i (k)およびnt,i (k)に関連付けられた前方関数選択(225)および後方関数選択(240)を推定する必要があり、kは逐次反復的な推定プロセスにおけるk番目の反復工程を表す。
ステップ1(305):初期化
1.k=0;
2.局所後方再整形関数(B<l>())を選択するために使用される後方マッピング・インデックス(BMI)のアレイ{nt,i (k)}(240)を初期化する(たとえば、定数c=L/2に)。
ステップ2(310):局所的な後方再整形(220)
入力再整形SDR信号(156)内の各ピクセル^st,i〔上付きの^を便宜上このように記すことがある〕について、対応する再整形関数インデックスnt,i (k)を見出し、対応する後方再整形関数を適用して、再構成されたHDR信号^vt,i (k)
を生成する:
ステップ3(315):再構成されたHDR画像に基づいて、前方マッピング・インデックス(forward mapping indices、FMI)(225)の推定アレイを生成する。G()関数は、エンコーダによって使用される関数と同じであってもよい。
1.まず、既存の推定FMIおよびBMIアレイの間の差
2.次に、平均差に基づいてBMIアレイを更新する。
ステップ5(330):BMI値の更新されたアレイ(240)を与えられて、局所後方再整形を再度実行する(220)。各入力再整形SDRピクセルについて、更新された後方再整形関数インデックスnt,i'(k)を見出し、局所後方再整形(220)を適用して、再構成されたHDR信号の更新された(2番目の)バージョンを得る。
ステップ6(335):更新されたHDR再構成信号に基づいて、第2のFMIアレイ(225)を推定する
各ピクセル
ステップ9(350):収束を判定し、BMIアレイを更新する
1.全体的な誤差を計算する
2.全体的な誤差(Dt (k))が閾値Δ(たとえば、非正規化10ビットデータについてΔ=0.5)より小さい場合、デコーダは収束している。現在のBMIアレイ{n't,i (k)}は、最終的なものとみなされ、出力ステップ355において、ステップ5(330)(式(14))の出力は、最終的な再構成されたHDR出力とみなされる。
3.Dt (k)>Dt (k-1)であれば、よりよい解を見つけることはできないかもしれない。前のBMIアレイ{nt,i (k-1)}は、最終的なものとみなされ、出力ステップ355において、前に生成された信号
4.そうでない場合(ステップ360)(Dt (k)>ΔかつDt (k)<Dt (k-1))、再整形されたSDR差に基づいてBMIアレイを更新(235)し、ステップ2(310)に戻る。すなわち、
これまで述べてきた方法は、どのような種類の可逆的な再整形関数にも適用できる。このセクションでは、局所再整形関数のいくつかの具体的な例とその属性について考察する。
大域的な前方および後方再整形関数を、それぞれF()およびB()と表す。理想的には、量子化誤差の範囲内でF()=B-1()である。ある実施形態では、局所再整形関数の選択は、ルーマ・ピクセルの属性(たとえば、それらの値、または近傍ピクセルに基づいて計算される値、たとえば、平均、標準偏差など)に依存しうる。
ある実施形態では、局所再整形関数の集合について、以下の属性が望ましいことがありうる:
・局所再整形を使用して、再整形されたSDR画像の鮮鋭度とコントラスト比を局所的に高める。これは、x軸において大域的な前方再整形関数を圧縮しつつ、各局所前方再整形関数の勾配を増加させることによって、すなわち、SDR y軸において同じ範囲を維持しつつ、HDR x軸において大域的な再整形関数の平坦でない領域の幅(範囲)を減少させることによって達成されうる。このx軸圧縮比をαと表す(0<α<1)。
・一定の大域的な明るさを維持する。これは、HDR符号語が与えられた場合、各局所再整形関数が、大域的再整形関数によって提供される値に近い再整形されたSDR値を与えれば、達成されうる。
第1のステップは、その入力および出力範囲(たとえば、その最小および最大入力および出力符号語)、平坦でない範囲におけるその中間値などの、大域的前方再整形関数の属性を同定することである。限定するものではないが、16ビットのHDRデータ(4,000ニト、PQ)を10ビットのSDRデータ(100ニト、ガンマ)にマッピングする、大域的前方再整形関数の例が図4Aに示されている。図4Aに示されているように、典型的な大域的な再整形関数は、有効な入力値および出力値と考えられるものに対する制限のために、暗い領域およびハイライト領域に2つの平坦な領域を有するシグモイド特性を有する。テンプレート前方再整形関数を構築するために、それらの平坦な領域を除外し、傾き>0の領域のみを考慮(スケール)することができる。一例として、非平坦領域の始点と終点を識別するために、表1の擬似コードを適用することができる。ここで、δは、我々の計算の数値精度に関連する、ゼロより大きい、非常に小さい閾値を示す(たとえば、浮動小数点演算についてはδ=0.0001)。
vr=vH-vL (23)
として計算できる。
有効な入力HDR範囲の中点は、
vM=round(vH+vL)/2 (24)
として計算できる。
ステップ2。テンプレート前方再整形関数を生成する
x軸の圧縮比αが与えられた場合、HDR信号の新しいスケーリングされた範囲は
天井演算子のため、αの値は
α=vT,R/vR (26)
として更新されてもよい。
次いで、テンプレート前方再整形関数が表2に示されるように構築されてもよい。
ステップ3。テンプレート後方再整形関数を生成
テンプレート後方再整形関数BT()は、テンプレート前方再整形関数を逆にすることによって再構築できる。例示的なプロセスが表3に記載される。所与の場合、図4B、図4Cのテンプレート前方再整形関数は、対応するテンプレート後方再整形関数を呈示する。
テンプレート前方再整形関数およびテンプレート後方再整形関数が与えられて、以下のように局所再整形関数のファミリー全体を構築することができる。
L個の局所前方再整形関数F<l>()およびB<l>()の構築を考える。mt,i=lの場合、i番目のHDRピクセルは、l番目の前方再整形関数を使用して再整形される。ある実施形態では、まず、入力符号語範囲をL個の一様区間に分割し、各区間について中心を見出すことができる。
局所再整形関数の提案されるスケールおよびシフト・ベースの導出における潜在的な問題の一つは、局所領域におけるハードなハイライト/暗部クリッピングである。勾配が高くなるにつれて、ハイライト部と暗部はより早く飽和する。早期飽和の問題を避けるために、次の代替的な解決策を適用することができる。
そのような実施形態では、たとえば、クリッピングを回避するために、ハイライト部分とダーク部分〔暗部〕におおいてスケーリングを回避してもよい。ルーマ領域において遷移をなめらかにするために、暗い色調から中間色調まで、スケーリング因子を1から目標値(たとえば0.8)に徐々に変化させ、中間色調では一定値のままでいて、ハイライト部分では徐々に1まで増加させてもよい。このアプローチでは、早期飽和の問題を遅らせることができる。他方、このアプローチではコントラスト比が低下することも示唆される。
この実施形態のもとでは、飽和部分を遠ざけるために、局所再整形関数と大域的再整形関数の重み付けされた線形結合を適用してもよい。重み付け因子は、輝度の関数であってもよい。局所再整形関数が暗い部分またはハイライト部分にある場合、重みは大域的関数に向けられ、局所関数が中間調にある場合、重みは局所関数に向けられる。
本発明者らによって認識されるように、大域的再整形関数が単純な1対1マッピングである場合、先に議論したアルゴリズムを用いて構築されるような局所前方再整形関数の集合は、鮮鋭化演算子として使用されてもよい。よって、ある実施形態では、伝送されたSDR画像の知覚される鮮鋭度を改善することを最終的な目標として、SDRからSDRへのマッピングのために、一組の局所再整形関数を使用することができる。
局所再整形は、いかなる追加的メタデータも必要としないが、局所再整形関数が局所的に再構築されるように、局所前方再整形関数および後方再整形関数、または、少なくとも、たとえばメタデータ152によって定義される、大域的な前方再整形関数および/または大域的な後方再整形関数の特性のあらかじめ定義された知識を必要とする場合がある。局所後方再整形を適用できないレガシー・デコーダでも、入来するSDR信号が局所再整形器を用いて符号化されていたとしても、(たとえば、図1Bに示されるような)大域的再整形を適用することができる。
本発明の実施形態は、コンピュータ・システム、電子回路およびコンポーネントにおいて構成されるシステム、集積回路(IC)、たとえばマイクロコントローラ、フィールド・プログラマブル・ゲート・アレイ(FPGA)、または他の構成可能またはプログラマブルなロジック・デバイス(PLD)、離散時間またはデジタル信号プロセッサ(DSP)、特定用途向けIC(ASIC)、および/またはそれらのシステム、デバイスまたはコンポーネントの一つまたは複数を含む装置を用いて実装されうる。コンピュータおよび/またはICは、ここに記載されるようなブラインド局所再整形に関する命令を実行、制御、または執行することができる。コンピュータおよび/またはICは、ここに記載されるようなブラインド局所再整形に関連する多様なパラメータまたは値の任意のものを計算することができる。画像およびビデオのダイナミックレンジ拡張実施形態は、ハードウェア、ソフトウェア、ファームウェア、およびそれらのさまざまな組み合わせで実装されうる。
よって、HDR画像のためのブラインド局所再整形に関連する例示的な実施形態が記載される。上記の明細において、本発明の実施形態は、実装毎に変化しうる多数の個別的詳細を参照して説明されてきた。何が本発明であり、出願人によって本発明であると意図されているかの唯一にして排他的な指標は、この出願に対して付与される特許の請求項の、その後の訂正があればそれも含めてかかる請求項が特許された特定の形のものである。かかる請求項に含まれる用語について本稿で明示的に記載される定義があったとすればそれは請求項において使用される当該用語の意味を支配する。よって、請求項に明示的に記載されていない限定、要素、属性、特徴、利点もしくは属性は、いかなる仕方であれかかる請求項の範囲を限定すべきではない。よって、明細書および図面は制約する意味ではなく例示的な意味で見なされるべきものである。
Claims (13)
- 2つ以上の局所後方再整形関数の集合および2つ以上の局所前方再整形関数の集合を使って、再構成された画像を生成する方法であって、当該方法は:
第1のダイナミックレンジにおける入力再整形画像(156)を受領する段階と;
第1の後方マッピング・インデックス(BMI)アレイを初期化する段階(305)であって、前記第1のBMIアレイの各要素は、前記入力再整形画像のピクセルに対応し、2つ以上の局所後方再整形関数の前記集合における局所後方再整形関数のインデックスを示し、局所後方再整形関数は、前記第1のダイナミックレンジからのピクセル値を第2のダイナミックレンジにおけるピクセル値にマッピングする、段階と;
前記第2のダイナミックレンジにおける出力再構成画像を生成するために一つまたは複数の反復工程を実行する段階とを含み、反復工程は:
i)前記第1のBMIアレイに従って前記入力再整形画像に2つ以上の局所後方再整形関数の前記集合を適用することによって前記第2のダイナミックレンジにおける第1の再構成された画像を生成する段階(310)と;
ii)前記第1の再構成された画像をFMI生成関数への入力として使って、第1の前方マッピング・インデックス(FMI)アレイを生成する段階(315)であって、前記第1のFMIアレイの各要素は、前記第1の再構成された画像におけるピクセルに対応し、2つ以上の局所前方再整形関数の前記集合における局所前方再整形関数のインデックスを示し、局所前方再整形関数は、前記第2のダイナミックレンジからのピクセル値を前記第1のダイナミックレンジにおけるピクセル値にマッピングする、段階と;
iii)前記入力再整形画像および前記第1の再構成された画像の両方における同じピクセルに対応する前記第1のBMIアレイおよび前記第1のFMIアレイの要素の間の差に基づく第1の誤差メトリックに従って、マッピング・インデックス誤差を生成する段階と;
iv)前記第1のBMIアレイおよび前記マッピング・インデックス誤差に基づいて、第2のBMIアレイを生成する段階(325)と;
v)前記第2のBMIアレイに従って前記入力再整形画像に局所後方再整形関数の前記集合を適用することによって、前記第2のダイナミックレンジにおける第2の再構成された画像を生成する段階(330)と;
vi)前記第2の再構成された画像を前記FMI生成関数への入力として使って、第2のFMIアレイを生成する段階(335)と;
vii)前記第2のFMIアレイに従って前記第2の再構成された画像に局所前方再整形関数の前記集合を適用することによって前記第1のダイナミックレンジにおける推定再整形画像を生成する段階(340)と;
viii)前記推定再整形画像と前記入力再整形画像との差に基づく第2の誤差メトリックに従って、再整形画像誤差を生成する段階と;
ix)前記再整形画像誤差と前記マッピング・インデックス誤差の組み合わせが収束基準を満たすかどうかを試験する段階であって:
前記収束基準が満たされている場合、前記反復工程を終了し、前記第2の再構成された画像を前記出力再構成画像として出力し;
そうでない場合:
前記第2のBMIアレイの要素および前記再整形画像誤差に基づいて、前記BMIアレイの要素を置換し(360);
もう一つの反復工程を実行する、段階とを含む、
方法。 - 前記第1のBMIアレイのすべての要素は、定数値に初期化される、請求項1に記載の方法。
- L個の局所後方再整形関数の集合について、前記第1のBMIアレイのすべての要素がL/2に初期化される、請求項2に記載の方法。
- 前記第1の再構成された画像内のピクセル値について、前記FMI生成関数は、前記第1の再構成された画像内の該ピクセル値を囲む一つまたは複数のピクセルの輝度属性に従って、値を前記FMIアレイの対応する要素に割り当てる、請求項1ないし3のうちいずれか一項に記載の方法。
- G1()が低域通過フィルタまたはガウスぼかしフィルタを含む、請求項5に記載の方法。
- 前記第1の誤差メトリックは、前記入力再整形画像および前記第1の再構成された画像の両方における同じピクセルに対応する前記第1のBMIアレイおよび前記第1のFMIアレイの要素の間の前記差の平均絶対誤差または平均二乗誤差である、請求項1ないし6のうちいずれか一項に記載の方法。
- 前記第2の誤差メトリックは、前記推定再整形画像および前記入力再整形画像の対応するピクセルの間の差の平均絶対誤差または平均二乗誤差である、請求項1ないし7のうちいずれか一項に記載の方法。
- k番目の反復工程において、前記収束基準は、前記マッピング・インデックス誤差および前記再整形画像誤差の重み付けされた和を計算し、前記重み付けされた和が逐次反復閾値よりも低いかどうかを試験することを含む、請求項1ないし9のうちいずれかに記載の方法。
- 一つまたは複数の前方再整形関数の前記集合を生成することを:
大域的前方再整形関数にアクセスする段階と;
前記大域的前方再整形関数のための属性値を生成する段階であって、前記属性値は、前記第2のダイナミックレンジにおけるその関数の非平坦領域、前記第2のダイナミックレンジにおける前記関数の非平坦領域の中間点、および前記第2のダイナミックレンジにおける暗部およびハイライトのための平坦領域のうちの一つまたは複数を含む、段階と;
前記大域的前方再整形関数、前記属性値、および非平坦領域スケーリング因子に基づいてテンプレート前方再整形関数を生成する段階と;
前記テンプレート前方再整形関数の逆関数を計算することによって、テンプレート後方再整形関数を生成する段階と;
前記第2のダイナミックレンジにおける輝度値のターゲット範囲に関連する局所前方再編成関数のために、
前記テンプレート前方再整形関数をx軸シフト値だけシフトさせることによって、該局所前方再整形関数を生成する段階であって、前記x軸シフト値は、輝度値の前記ターゲット範囲について、前記局所前方再整形関数および前記大域的前方再整形関数を用いて対応する平均再整形出力値がほぼ等しくなるように決定される、段階と
を実行することによって行うことをさらに含む、
請求項1ないし10のうちいずれか一項に記載の方法。 - 請求項1ないし11のうちいずれか一項に記載の方法を一つまたは複数のプロセッサで実行するためのコンピュータ実行可能命令を記憶している非一時的なコンピュータ読み取り可能な記憶媒体。
- プロセッサを有しており、請求項1ないし11のうちいずれか一項に記載の方法を実行するように構成されている装置。
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US202063004609P | 2020-04-03 | 2020-04-03 | |
US63/004,609 | 2020-04-03 | ||
EP20167908.1 | 2020-04-03 | ||
EP20167908 | 2020-04-03 | ||
PCT/US2021/025464 WO2021202933A1 (en) | 2020-04-03 | 2021-04-01 | Blind local reshaping in hdr imaging |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2023510038A JP2023510038A (ja) | 2023-03-10 |
JP7309081B2 true JP7309081B2 (ja) | 2023-07-14 |
Family
ID=75581704
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022560080A Active JP7309081B2 (ja) | 2020-04-03 | 2021-04-01 | Hdrイメージングにおけるブラインド局所再整形 |
Country Status (5)
Country | Link |
---|---|
US (1) | US20230156343A1 (ja) |
EP (1) | EP4128762B1 (ja) |
JP (1) | JP7309081B2 (ja) |
CN (1) | CN115362675A (ja) |
WO (1) | WO2021202933A1 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2023096728A1 (en) * | 2021-11-29 | 2023-06-01 | Dolby Laboratories Licensing Corporation | Denoising for sdr-to-hdr local reshaping |
EP4277281A1 (en) * | 2022-05-12 | 2023-11-15 | Koninklijke Philips N.V. | Hdr video reconstruction by converted tone mapping |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2017019818A1 (en) | 2015-07-28 | 2017-02-02 | Vid Scale, Inc. | High dynamic range video coding architectures with multiple operating modes |
WO2017024042A2 (en) | 2015-08-04 | 2017-02-09 | Dolby Laboratories Licensing Corporation | Signal reshaping for high dynamic range signals |
WO2017165494A2 (en) | 2016-03-23 | 2017-09-28 | Dolby Laboratories Licensing Corporation | Encoding and decoding reversible production-quality single-layer video signals |
WO2020068666A1 (en) | 2018-09-24 | 2020-04-02 | Dolby Laboratories Licensing Corporation | Image denoising in sdr to hdr image conversion |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
MX2010008978A (es) * | 2008-03-07 | 2010-09-07 | Toshiba Kk | Aparato de codificacion / decodificacion de video. |
US10032262B2 (en) | 2016-02-02 | 2018-07-24 | Dolby Laboratories Licensing Corporation | Block-based content-adaptive reshaping for high dynamic range images |
-
2021
- 2021-04-01 EP EP21720146.6A patent/EP4128762B1/en active Active
- 2021-04-01 WO PCT/US2021/025464 patent/WO2021202933A1/en active Application Filing
- 2021-04-01 CN CN202180026216.3A patent/CN115362675A/zh active Pending
- 2021-04-01 US US17/916,780 patent/US20230156343A1/en active Pending
- 2021-04-01 JP JP2022560080A patent/JP7309081B2/ja active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2017019818A1 (en) | 2015-07-28 | 2017-02-02 | Vid Scale, Inc. | High dynamic range video coding architectures with multiple operating modes |
WO2017024042A2 (en) | 2015-08-04 | 2017-02-09 | Dolby Laboratories Licensing Corporation | Signal reshaping for high dynamic range signals |
WO2017165494A2 (en) | 2016-03-23 | 2017-09-28 | Dolby Laboratories Licensing Corporation | Encoding and decoding reversible production-quality single-layer video signals |
WO2020068666A1 (en) | 2018-09-24 | 2020-04-02 | Dolby Laboratories Licensing Corporation | Image denoising in sdr to hdr image conversion |
Non-Patent Citations (1)
Title |
---|
Taoran Lu, et al.,CE12: Mapping functions (test CE12-1 and CE12-2),Joint Video Experts Team (JVET) of ITU-T SG 16 WP 3 and ISO/IEC JTC 1/SC 29/WG 11,JVET-M0427-v2,13th Meeting: Marrakech, MA,2019年01月,pp.1-15 |
Also Published As
Publication number | Publication date |
---|---|
JP2023510038A (ja) | 2023-03-10 |
WO2021202933A1 (en) | 2021-10-07 |
CN115362675A (zh) | 2022-11-18 |
EP4128762B1 (en) | 2024-03-20 |
EP4128762A1 (en) | 2023-02-08 |
US20230156343A1 (en) | 2023-05-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7189230B2 (ja) | ニューラルネットワークマッピングを用いるhdr画像表現 | |
JP6181259B2 (ja) | エンハンストダイナミックレンジ信号の階層符号化のための適応的再構成 | |
KR101939012B1 (ko) | 하이 다이내믹 레인지 이미지들을 위한 콘텐츠 적응적 지각 양자화기 | |
JP6846442B2 (ja) | ハイダイナミックレンジ画像のためのクロマ再構成 | |
JP6771656B2 (ja) | シングルレイヤー後方互換性コーデックのリアルタイム再構成 | |
JP7049526B2 (ja) | 適応的なsdrからhdrへの再構成関数による、hdr画像化におけるバンディングアーチファクトの低減 | |
EP3375190B1 (en) | High dynamic range color conversion correction | |
JP7094451B2 (ja) | 再構成関数の補間 | |
JP7046270B2 (ja) | 後方互換性を有するhdr画像化における、バンディングアーチファクトの低減 | |
JP7309081B2 (ja) | Hdrイメージングにおけるブラインド局所再整形 | |
US10742986B2 (en) | High dynamic range color conversion correction | |
JP7329155B2 (ja) | 連続性及び可逆性を備えたhdr画像化のためのリシェーピング関数 | |
US10715772B2 (en) | High dynamic range color conversion correction | |
JP2023532952A (ja) | Hdrビデオのクラウド・ベース符号化における作業負荷割り当ておよび処理 | |
JP2023533681A (ja) | オープン・ループ・コーデックにおけるhdr撮像に関する画像予測 | |
WO2023069585A1 (en) | Context-based reshaping algorithms for encoding video data | |
WO2019071045A1 (en) | HIGH DYNAMIC RANGE COLORING CORRECTION |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20220930 |
|
A871 | Explanation of circumstances concerning accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A871 Effective date: 20221007 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230214 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230511 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20230606 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20230704 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7309081 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |