JP6846442B2 - ハイダイナミックレンジ画像のためのクロマ再構成 - Google Patents

ハイダイナミックレンジ画像のためのクロマ再構成 Download PDF

Info

Publication number
JP6846442B2
JP6846442B2 JP2018560837A JP2018560837A JP6846442B2 JP 6846442 B2 JP6846442 B2 JP 6846442B2 JP 2018560837 A JP2018560837 A JP 2018560837A JP 2018560837 A JP2018560837 A JP 2018560837A JP 6846442 B2 JP6846442 B2 JP 6846442B2
Authority
JP
Japan
Prior art keywords
reconstruction function
chroma
luma
reconstruction
pixel value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2018560837A
Other languages
English (en)
Other versions
JP2019523578A (ja
Inventor
ソォン,チィン
スゥ,グワン‐ミーン
チェン,チェン
チェン,タオ
Original Assignee
ドルビー ラボラトリーズ ライセンシング コーポレイション
ドルビー ラボラトリーズ ライセンシング コーポレイション
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ドルビー ラボラトリーズ ライセンシング コーポレイション, ドルビー ラボラトリーズ ライセンシング コーポレイション filed Critical ドルビー ラボラトリーズ ライセンシング コーポレイション
Priority claimed from PCT/US2017/033056 external-priority patent/WO2017201139A1/en
Publication of JP2019523578A publication Critical patent/JP2019523578A/ja
Application granted granted Critical
Publication of JP6846442B2 publication Critical patent/JP6846442B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/186Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a colour or a chrominance component
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/85Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/98Adaptive-dynamic-range coding [ADRC]

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Image Processing (AREA)
  • Processing Of Color Television Signals (AREA)
  • Transforming Electric Information Into Light Information (AREA)
  • Video Image Reproduction Devices For Color Tv Systems (AREA)

Description

関連出願への相互参照
本願は、2016年5月19日に出願された欧州特許出願第16170446.5号および2016年5月19日に出願された米国仮出願第62/338,638号に基づく優先権を主張するものであり、両出願の開示内容を全て本願に援用する。
技術
本発明は、画像全般に関する。より詳細には、本発明のある実施形態は、ハイダイナミックレンジを有する画像のクロマ再構成に関する。
背景
本明細書において、用語「ダイナミックレンジ」(DR)は、人間の視覚システム(HVS)が画像においてある範囲の強度(例えば、輝度、ルマ)(例えば、最も暗いグレー(黒)から最も明るい白(ハイライト)まで)を知覚する能力に関連し得る。この意味では、DRはシーン−リファード(scene−referred)の強度に関する。DRはまた、ディスプレイデバイスが特定の幅を有する強度範囲を妥当にまたは近似的に描画する能力にも関連し得る。この意味では、DRは、ディスプレイ−リファード(display−referred)の強度に関する。本明細書中の任意の箇所において、ある特定の意味が特に明示的に指定されている場合を除いて、この用語はどちらの意味としても(例えば、区別なく)使用できるものとする。
本明細書において、ハイダイナミックレンジ(HDR)という用語は、人間の視覚システム(HVS)において14〜15桁ほどにわたるDR幅に関する。実際において、人間が広範囲の強度範囲を同時に知覚し得るDRは、HDRに対して幾分端折られ得る。本明細書において、エンハンストダイナミックレンジ(EDR)または視覚ダイナミックレンジ(VDR)という用語は、個別にまたは区別なく、人間の視覚システム(HVS)(眼球運動を含み、シーンまたは画像にわたってある程度の明順応変化を可能にする)が、あるシーンまたは画像中において知覚可能なDRに関する。本明細書において、EDRは、5〜6桁にわたるDRに関連し得る。従って、真のシーンリファードのHDRに対しては幾分狭いものの、EDRは広いDR幅を表し、HDRとも呼ばれ得る。
実際において、画像は1つ以上の色成分(例えばルマYおよびクロマCbおよびCr)を有しており、各色成分は、画素あたりnビットの精度(例えばn=8)で表される。線形輝度符号化(linear luminance coding)を用いた場合、n≦8の画像(例えばカラー24ビットJPEG画像)はスタンダードダイナミックレンジとされ、n>8の画像はエンハンストダイナミックレンジの画像とされる。EDRおよびHDR画像はまた、Industrial Light and Magicが開発したOpenEXRファイルフォーマットなどの高精度の(例えば16ビット)浮動小数点フォーマットを用いて、格納および配信され得る。
あるディスプレイについてのリファレンス電気光学伝達関数(EOTF)は、入力映像信号の明度(color values)(例えば輝度)からそのディスプレイによって生成される出力スクリーン明度(例えばスクリーン輝度)への関係を特徴づける。例えば、その開示内容を全て本願に援用するITU Rec.ITU−R BT. 1886、「Reference electro−optical transfer function for flat panel displays used in HDTV studio production」(03/2011)では、陰極線管(CRT)の測定された特性に基づいて、フラットパネルディスプレイについてのリファレンスEOTFを定義している。ある映像ストリームが与えられたとき、そのEOTFに関する情報は、典型的にはメタデータとしてビットストリーム中に埋め込まれる。本明細書において、「メタデータ」の語は、符号化ビットストリームの一部として送信され、デコーダが復号化画像を描画することを助ける、任意の補助的情報に関する。そのようなメタデータは、本明細書において記載されるような、色空間または色域情報、リファレンスディスプレイパラメータ、および補助的な信号パラメータなどを含むが、これらに限定されない。
ほとんどのコンシューマー用デスクトップディスプレイは現在、200〜300cd/m2またはニトの輝度をサポートしている。ほとんどのコンシューマー用HDTVは300〜500ニトの範囲であるが、新しいモデルは1000ニト(cd/m2)に達する。このような従来のディスプレイはしたがって、HDRやEDRに対し、より低いダイナミックレンジ(LDR)(またはスタンダードダイナミックレンジ(SDR)とも呼ばれる)の典型例となる。キャプチャ機器(例えばカメラ)およびHDRディスプレイ(例えばDolby LaboratoriesのPRM−4200プロフェッショナルリファレンスモニター)両方の進化によって、HDRコンテンツの普及率が高まるにつれ、HDRコンテンツはカラーグレーディングされてより高いダイナミックレンジ(例えば1,000ニトから5,000ニト以上)をサポートするHDRディスプレイ上に表示されることがある。そのようなディスプレイは、高輝度能力(例えば0から10,000ニトなど)をサポートする代替的なEOTFを用いて定義され得る。そのようなEOTFの一例が、その開示内容を全て本願に援用するSMPTE ST 2084:2014「High Dynamic Range EOTF of Mastering Reference Displays」に定義されている。一般的に、限定しないが、本開示の方法はSDRよりも高い任意のダイナミックレンジに関連する。
本明細書において、用語「再構成」は、HDR画像に対するスケーリング、量子化などの前処理操作を指し、元のビット深度からより低いかまたは同一のビット深度の画像へとマッピングすることで、既存の符号化規格および機器を用いたより効率的な符号化を可能にすることを言う。エンコーダが用いるための「順方向再構成」パラメータを、メタデータを用いて符号化ビットストリームの一部として受信器に伝え、準拠デコーダが「逆(inverse)」または「逆方向(backward)再構成」操作を適用することにより、元の信号をそのフルダイナミックレンジで復元し得る。再構成は、HDR信号のあらゆる全ての色成分に対して適用し得る。本発明者らの理解によれば、既存そして将来の符号化規格を改善するためには、HDR映像のクロマ再構成のための改善された技術が必要である。
本節に記載されている手法は、探求し得る手法ではあるが、必ずしもこれまでに着想または探求されてきた手法ではない。従って、別途示唆のない限り、本節に記載された手法のいずれも、本節に記載されているという理由だけで従来技術としての適格性を有すると考えるべきではない。同様に、別途示唆のない限り、1以上の手法に関して特定される問題が、本節に基づいて、いずれかの先行技術において認識されたことがあると考えるべきではない。
図面の簡単な説明
同様の部材に同様の参照符号を付した添付図面の各図において、本発明のある実施形態を限定する事なく例示する。
図1Aは、映像供給パイプラインのプロセス例を示す。 図1Bは、本発明のある実施形態による、コンテンツ適応的な量子化または再構成を用いたデータ圧縮のプロセス例を示す。 図2は、本発明のある実施形態による、リファレンスクロマ再構成関数の例を示す。 図3は、本発明のある実施形態による、コンテンツ依存の、最大の可能スケーリング係数の例を示す。 図4は、本発明のいくつかの実施形態による、コンテンツ依存の再構成関数の例を示す。 図5Aは、本発明のいくつかの実施形態によるクロマ再構成のプロセス例を示す。 図5Bは、本発明のいくつかの実施形態によるクロマ再構成のプロセス例を示す。 図6は、本発明のある実施形態による、順方向再構成係数ルックアップテーブル(LUT)において表現され得る、クロマ再構成関数の例を示す。
例示的な実施形態の説明
ハイダイナミックレンジ(HDR)画像のためのクロマ再構成技術を、本明細書に記載する。以下の説明においては、便宜上、本発明を完全に理解できるように、多数の詳細事項を説明する。ただし、これらの詳細事項が無くても本発明を実施可能であることは明白であろう。他方、本発明の説明を不必要に煩雑にしたり、不明瞭にしたり、難読化したりしないように、周知の構造およびデバイスの細かな詳細までは説明しない。
概要
本明細書に記載する実施形態例は、HDR画像のクロマ再構成に関する。適応的なクロマ再構成のためのプロセッサが、ルマ(輝度)成分および1つ以上のクロマ成分を有する入力画像を受け取る。プロセッサは、入力画像のルマ成分に基づいて、ルマ再構成化画像を生成する。入力画像のクロマ成分に対して、ルマ再構成化画像中の画素値群の範囲を階級に分割し、各階級について、その階級におけるルマ再構成化画像の画素値群に対応するクロマ画素値群に基づき、最大スケールファクタ群を生成する。リファレンス再構成関数および最大スケールファクタ群に基づいて、再構成化ルマ値群をクロマスケールファクタ群にマッピングする順方向再構成関数を生成し、入力クロマ画素値群と、順方向再構成関数と、ルマ再構成化画像中の対応する画素値群とに基づいて、クロマ成分についての再構成化クロマ画素値群を生成する。
別の実施形態において、複数の順方向再構成関数の予め算出されたパラメータ群を有するルックアップテーブルを用いて、順方向再構成関数のパラメータ群を決定する。これらの関数のそれぞれは、順方向再構成関数の所望のクロス点を特徴付ける(xT,yn*)座標によって完全に定義される。ここでxT座標は、リファレンス再構成関数未満である最大スケール値群の値が、リファレンス再構成関数から最大の距離を有するような、ある再構成化ルマ値に対応する。
別の実施形態において、リファレンスおよび順方向再構成関数は、入力画像中のルマ画素値群の関数であり、クロマ再構成は、ルマ再構成化画像の画素値群ではなく、元のルマ画素値群に基づいて行われる。
映像供給処理パイプライン例
図1Aは、従来の映像供給パイプライン(100)のプロセス例を示しており、映像のキャプチャから映像コンテンツの表示までの、様々な段を示している。画像生成ブロック(105)を用い、映像フレームのシーケンス(102)をキャプチャまたは生成する。映像フレームは、デジタル的にキャプチャされるか(例えばデジタルカメラにより)またはコンピュータ(例えばコンピュータアニメーションを用いて)によって生成されることにより、映像データ(107)が得られる。あるいは映像フレーム(102)は、銀塩カメラによってフィルム上に取得されてもよい。フィルムがデジタルフォーマットに変換されることによって、映像データ(107)が得られる。プロダクションフェーズ(110)において、映像データ(107)は編集され、映像プロダクションストリーム(112)を得る。
プロダクションストリーム(112)の映像データは次に、ブロック(115)のプロセッサに与えられて、ポストプロダクション編集を受ける。ブロック(115)ポストプロダクション編集は、画像の特定の領域の色または明るさを調節または変更することにより、映像制作者の制作意図にしたがってその画像が特定の見え方をするようにしたり、画質を上げたりすることを含み得る。これは、「カラータイミング」あるいは「カラーグレーディング」と呼ばれることがある。ブロック(115)において、その他の編集(例えば、シーン選択およびシーケンシング、画像クロッピング、コンピュータ生成された視覚的特殊効果の追加など)を行うことにより、プロダクションの、配信用の最終バージョン(117)を作成してもよい。ポストプロダクション編集(115)において、映像イメージは、リファレンスディスプレイ(125)上で視聴される。
ポストプロダクション(115)の後、最終プロダクションとしての映像データ(117)は、下流のテレビ受像機、セットトップボックス、映画館などの復号化・再生機器まで供給されるために、符号化ブロック(120)に供給されてもよい。いくつかの実施形態において、符号化ブロック(120)は、符号化されたビットストリーム(122)を生成するための、ATSC、DVB、DVD、ブルーレイおよびその他の供給フォーマットに規定されるような音声および映像エンコーダを有していてもよい。受信機において、符号化されたビットストリーム(122)は、復号化ユニット(130)により復号化されることにより、信号(117)と同一またはこれに近い近似を表す、復号化された信号(132)を生成し得る。受信機は、リファレンスディスプレイ(125)と全く異なる特性を有し得るターゲットディスプレイ(140)に取り付けられていてもよい。その場合、ディスプレイマネジメントブロック(135)を用いてディスプレイマッピング化信号(137)を生成することで、復号化された信号(132)のダイナミックレンジを、ターゲットディスプレイ(140)の特性にマッピングしてもよい。
信号の再構成
現在、映像供給用のほとんどのデジタルインターフェース、例えばSerial Digital Interface(SDI)などは、各成分につき画素あたり12ビットに制限されている。さらに、ほとんどの圧縮規格の実用的な態様は、例えばH.264(またはAVC)およびH.265(またはHEVC)などは、各成分につき画素あたり10ビットに制限されている。したがって、既存のインフラストラクチャおよび圧縮規格内において、約0.001から10,000cd/m2(またはニト)のダイナミックレンジを有するHDRコンテンツをサポートするためには、効率的な符号化および/または量子化が必要である。
本明細書において、用語「PQ」は知覚的な輝度振幅(luminance amplitude)の量子化を指す。人間の視覚システムは、光レベルの増大に対して非常に非線形的に反応する。人間が刺激を見る能力は、その刺激の輝度、その刺激の大きさ、その刺激を構成する空間周波数、および、その刺激を見ている瞬間までに目が適応した輝度レベルに影響される。好適な実施形態において、知覚的量子化器関数は、線形入力グレイレベルを、人間の視覚システムにおけるコントラスト感度閾値によりマッチした出力グレイレベルにマッピングする。PQマッピング関数の一例が、その開示内容を全て本願に援用する、SMPTE ST 2084:2014「High Dynamic Range EOTF of Mastering Reference Displays」に記載されている。ここでは、ある固定刺激サイズに対して、それぞれの輝度レベル(即ち、刺激レベル)について、最高感度の適応レベルおよび最高感度の空間周波数(HVSモデルによる)に応じて、その輝度レベルにおける最小可視コントラストステップを選択する。物理的な陰極線管(CRT)装置の応答曲線を表しており、人間の視覚システムの応答の仕方に対して非常に大まかな類似性を偶然有し得る従来のガンマ曲線と比較して、PQ曲線は、比較的シンプルな関数モデルを用いながら人間の視覚システムの本当の視覚応答を模擬している。
例えば、SMPTE ST 2084によれば、1cd/m2において、1つの12ビット符号値は約0.0048cd/m2の相対変化に相当する。しかし、1,000cd/m2においては、1つの12ビット符号値は約2.24cd/m2の相対変化に相当する。この非線形的量子化は、人間の視覚システム(HVS)の非線形的なコントラスト感度に対応するために必要である。
図1Bは、一実施形態におけるコンテンツ適応的な再構成のプロセス例を示す。あるHDR信号の入力フレーム群(117)を与えられると、順方向再構成ブロック(150)が、入力および符号化制約を分析し、符号語マッピング関数を生成する。この符号語マッピング関数は、入力フレーム群(117)を、再量子化された出力フレーム群(152)にマッピングする。いくつかの実施形態において、順方向再構成(150)はまた、色変換、トーンマッピング、および彩度制御(saturation control)に関連する処理も含み得る。例えば、特定のEOTFにおいては、色変換の後、入力(117)はガンマ符号化またはPQ符号化され得る。いくつかの実施形態において、再構成プロセスに関する情報は、メタデータを用いて下流の機器(例えばデコーダ)に伝えられてもよい。符号化(120)および復号化(130)の後、前述したディスプレイマネジメントプロセス(135)などのさらなる下流処理のために、復号化フレーム群(133)が、再量子化されたフレーム群(133)を元のEOTFドメイン(例えばガンマまたはPQ)に再度変換する逆方向または逆再構成関数(160)による処理を受けてもよい。順方向再構成器(150)の変換によっては、逆再構成(160)はまた、逆トーンマッピング、色変換などの追加的な(逆)処理を含み得る。いくつかの実施形態において、逆方向または逆再構成関数(160)は、デコーダ(130)中の逆量子化器と一体化され得る(例えば、AVCまたはHEVC映像デコーダ中の逆量子化器の一部としてなどである)。いくつかの実施形態において、復号化された信号(133)は、復号化されて旧式のSDR受信器によって視聴され得る、後方互換的SDR信号であってもよい。したがって、旧式のSDR受信器は入力(112)のSDRバージョンのみしか視聴できない。一方、HDR受信器は、逆再構成を適用して、入力のHDRバージョン(162)を復元し得る。
信号再構成関数の一例が、2016年3月1日に出願されたJ.Froehlichらによる「Content−adaptive perceptual quantizer for high dynamic range images」の名称を有するPCT特許出願Ser.No.PCT/US2016/020230号に示されている。この出願の開示内容を全て本願に援用する。また、それぞれの対応するリファレンスSDR画像を用いた、HDR画像のためのルマおよびクロマ再構成技術が、2016年3月23日に出願された(また2017年3月22日にPCT/US2017/023543号としても出願された)、G−M Suらによる米国仮出願Ser.No.62/312,450号「Encoding and decoding reversible production−quality single−layer video signals」にも示されている。この出願の開示内容を全て本願に援用する。本発明において、それぞれの対応するSDR画像にアクセスすることのない、HDR画像のクロマ再構成のための新しい技術を提供する。
クロマ再構成技術
概要
本発明者らの知見によれば、あるHDR映像シーケンスが与えられたとき、SDRデコーダについての後方互換性を可能にするためのルマおよびクロマ再構成の後に、再構成化HDR映像信号(例えば133)をSDRディスプレイ上で視聴すると、色の彩度が下がって、すなわち色褪せて見える。直感的には、順方向再構成プロセスにおいて、各クロマチャンネルに対して単に固定のグローバルなスケーリング係数を適用することにより、クロマ彩度を増大すればよい。しかし、そのようなグローバルスケーリングでは、視覚的品質が多分に劣る、彩度が飽和した絵が得られてしまう。K.MinooらのドキュメントN15792「Exploratory Test Model for HDR extension of HEVC」ISO/IEC JTC1/SC29/WG11、Geneva,CH、Oct.2015および、A.K.RamasubramonianらのJCTVC−W0101、「HDR CE2.a−1: Report on LCS」、ITU−T SG 16 WP 3およびISO/IEC JTC1/SC 29/WG 11、San Diego,USA、Feb.2016において、画素強度あるいはルマ値に基づいたクロマ再構成技術が提案されている。しかし、これらの技術でさえ、彩度飽和の問題は解決されていない。
Figure 0006846442
が、再構成するHDR入力シーケンス(例えば117)中のj番目のフレームのi番目の画素のルマ(y)およびクロマ(u,v)成分を表すとする。
Figure 0006846442
が、順方向再構成されたSDR成分(例えば152または133)を表し、
Figure 0006846442
が、逆方向または逆再構成されたEDR成分(例えば162)を表すとする。これらはすべて、限定されないが、[0 1)間で正規化されている。
複数のテスト映像シーケンスのデータベースに基づき、一実施形態において、図2は順方向クロマ再構成関数の例
Figure 0006846442
を示す。これを以下においてリファレンス再構成関数と呼ぶ。リファレンス再構成関数は、入力再構成化ルマ値
Figure 0006846442
に対して、対応する順方向クロマ再構成ファクタ
Figure 0006846442
を生成する。リファレンス関数は、大抵の映像シーケンスについて満足な結果を提供するが、後述するように、入力コンテンツに従って調節される必要がある場合がある。実際において、この関数は多項式として表現され得る。例えば:
Figure 0006846442
ここで
Figure 0006846442
は、多項式の係数を表す。例えば、もし
Figure 0006846442
ならば、図2のグラフは二次多項式を用いて近似され得る。様々な映像シーケンス中の多くのフレームやシーンにおいて
Figure 0006846442
は十分であり得るが、特定の条件下においては、直接
Figure 0006846442
を適用すると彩度飽和やクリッピングに至ることが分かっている。したがって、再構成化クロマ値がデコーダにおいて適切に復元され得ずに、視覚的品質の劣るHDR信号が復元されてしまう。
Figure 0006846442
が、j番目のフレームに適用される順方向(可逆)再構成関数を表すとする。一実施形態において、u色成分についてのクロマ再構成は、再構成化ルマの関数として表現することができ、
Figure 0006846442
によって与えられる。
式(2)を与えられたとき、逆方向または逆再構成は、以下のように表現することができる。
Figure 0006846442
ここで
Figure 0006846442
は、逆再構成関数を表す。エンコーダは、順方向または逆再構成関数のいずれかに関するパラメータを、デコーダに送信し得る。
式(2〜3)において、クロマ値の順方向および逆再構成を、再構成化ルマ値を用いて行うことに留意されたいが、これは限定と考えられるべきではない。本明細書において説明する方法はすべて、元の、未変更のHDRルマ値
Figure 0006846442
に基づき再構成関数を生成することに適用可能である。ただしそのような方法は、デコーダが未構成のHDRルマ値を生成する能力を有することに依拠しているが、これはデコーダが旧式のSDRデコーダである場合にはそうではないかもしれない。
ここで仮に、関数fj()=fr()であると仮定する。再構成化ルマ値が0.8であるとすると、図2より、fr(0.8)=3である。式(2)から、クロマ値0.8について、
Figure 0006846442
であり、これはクリッピングし1となる。可逆的な再構成関数を維持するためには(そのことにより元のHDRクロマ値を完全に復元することが可能になる)、再構成に起因する情報のロスが無いようにfr()関数を構成することが望ましい。画像特性およびリファレンス再構成関数
Figure 0006846442
に基づき、適切に
Figure 0006846442
を定義する実施形態を、次に述べる。
コンテンツに応じた(Content−Aware)クロマ再構成
コンテンツ依存の最大スケールファクタの決定
再構成化ルマ値が、等しい幅W(例えばW=1/M)の、M個の階級に区分されていることを考える。階級の個数(M)は、典型的には演算リソース(例えばM=64)に依存する。この階級のそれぞれにおいて、
Figure 0006846442
の最大の絶対値のtパーセンタイルを見出すことが望ましい。ここで、tは0から100%の範囲を取り、可逆性を保存したい画素のパーセンテージを表す。例えば、t=100%においては、全ての画素値が可逆的であることが保証される。しかし、そのような強い要件は不要であり、また全体の質に影響し得る。t=99%において、クロマ情報の約1%が失われるが、これは典型的にはまったく許容可能である。
m番目の階級について、m=0,1,…,M−1とし、この階級中の、元の画像において再構成化ルマ値
Figure 0006846442
を有する全ての画素につき、例えば
Figure 0006846442
の間の値について、対応するクロマ値に対して
Figure 0006846442
を算出し、この階級中におけるこれらの
Figure 0006846442
値のtパーセンタイルを算出する。この値を、bj,mと表す。これは、以下のように表現することができる:
Figure 0006846442
ここで、
Figure 0006846442
は、区間[0,100]におけるベクトルxの値のtパーセンタイルを返す、パーセンタイル関数であり、
Figure 0006846442
は、オプションとしての重み付け係数である(例えばt=99%、η=1)。例えば、MATLABにおいては、
Figure 0006846442
はprctile(x,t)関数に対応する。実際において、t=100および重みη < 1は、
Figure 0006846442
関数をmaximum(x)関数で置き換えることに等しく、これは演算的にt<100およびη=1に設定することよりもずっと高速である。なぜなら、t<100について
Figure 0006846442
を算出するには、データをソートすることが必要であるが、これはxの最大値を単に算出するよりも多くの演算を要する。テストにおいて、η=0.85とともにt=100の値を用いると、多くのHDRシーケンスにおいて満足できる結果が得られる。bj,m値を与えられると、一実施形態において、対応する最大スケールファクタは、以下のように与えられる。

Figure 0006846442
ここで
Figure 0006846442
は、最大スケールを制限し、式(5)における集合
Figure 0006846442
が空である場合
Figure 0006846442
において無限大を避けるための値である。したがって、
Figure 0006846442
値の集合は、各階級について、クロマ値のオーバーフローまたはアンダーフローを回避する最大スケールファクタを規定する。
表記を単純化するために、bj,mおよび
Figure 0006846442
のいずれも、u色成分の関数として表記
Figure 0006846442
していないことに注意されたい。ただし、これらの値は、各クロマ成分について別々に算出されてもよく、また図3に示すように互いに異なってもいてもよい。
一例として、図3は、YCbCr色形式のテストシーケンスにおける2つのクロマ成分について算出した、リファレンスクロマ再構成関数(205)および対応する最大スケールファクタ群
Figure 0006846442
(310,315)を示す。図3に示すように、(0.6,0.7)の再構成化ルマ値間における特定の階級について、uチャンネルに対してリファレンス再構成関数を適用するとクリッピングとなる。
式(1)を与えられたとき、
Figure 0006846442
が、m番目の階級についてのリファレンススケールファクタを表すとする。すると、一実施形態において、式(6)および(7)より、最適なスケールファクタの集合は、以下のように与えられる。
Figure 0006846442
実験結果から、式(8)のスケーリング係数を用いることにより、クロマアーチファクトが生まれ得ることが分かっている。これらのアーチファクトは、
Figure 0006846442
値の不規則性(隣接する画素値の再構成化クロマにおける唐突な変化を起こす)に起因し得るものであると考えられる。さらに、不規則な順方向再構成値の集合に基づいて逆再構成関数を構築することは、かなりの演算的困難性を伴う。したがって、滑らかかつ容易に可逆的である、新たな順方向再構成関数を構築することが望ましい。
この新たな順方向再構成関数は、
Figure 0006846442
で示されるものとする。ここで、
Figure 0006846442
は、新たな順方向再構成関数の多項式係数群を表す。この関数は、
Figure 0006846442
と同様なスケールファクタを提供し、また同時に、
Figure 0006846442
という制約を満たす。
新たな再構成関数の出力は、入力色が(例えば中間色に)変更されることを防ぐために、常に0より大きくなければならない。
一実施形態において、式(9)における最適な
Figure 0006846442
係数の解は、所望のスケールファクタとリファレンススケールファクタとの距離を最小化することにより、導出され得る。例えば、
Figure 0006846442
ここで条件として、
Figure 0006846442
である。
このような解は、満足できる結果を生む。しかし、特定の色では、彩度が下がったとみなされることがある。別の実施形態において、距離
Figure 0006846442
を、m番目の階級における再構成化ルマ値の数に基づく重み付け係数
Figure 0006846442
によって乗算する。空でない階級の集合を
Figure 0006846442
とする。ここで、
Figure 0006846442
は、階級mにおける再構成化ルマ画素の数を表す(式(5)を参照)。すると、式(10)より、この問題は、最適化問題として公式化され得る。
Figure 0006846442
ここで条件として、
Figure 0006846442
である。
一例として、図4は、リファレンス再構成値rm(205)、クロマ成分のうち1つに関する
Figure 0006846442
値(310)、算出されたヒストグラムに基づき算出された対応する重みwj,m(405)、式(10)を用いかつ重みを考慮せずに算出された再構成ファクタ(415)、および式(12)を用いかつ重みを考慮して算出された再構成ファクタ(420)を示す。
順方向再構成関数を決定するための高速な方法多項式
Figure 0006846442
の次数を与えられれば、式(12)は、当該分野において公知の任意の多項式近似法を用いて解くことができる。例えば、総当たりモードにおいて、もし各係数がk個の値内に制限され得るとすれば、3つの未知の係数を有する二次多項式につき、k3個の値すべてについて繰り返しを行うことができる。出力再構成関数の係数を決定するためのより高速なアルゴリズムを次に提案する。
Figure 0006846442

Figure 0006846442
の開始点を表し、
Figure 0006846442
が曲線中の別の点(第2の(あるいはB)クロス点と表記する)を表すとする。ここで、
Figure 0006846442
である。この点は、リファレンス曲線未満でありかつリファレンス曲線から最大の距離を有する
Figure 0006846442
値と一致する。もし
Figure 0006846442
が常に正ならば、新たな
Figure 0006846442
関数を生成する必要は無く、単に
Figure 0006846442
を用いればよいことに留意されたい。一例として、図4において、
Figure 0006846442
点を点425と表記する。
これら2つの点を与えられれば、ある二次多項式について、式(12)の最適化問題は、1つの多項式係数
Figure 0006846442
を決定するだけの問題となる。
Figure 0006846442
を与えられれば、その他の2つの係数は、以下のように導出され得る。

Figure 0006846442
一実施形態において、範囲[−a,a]およびステップD(例えばD=2a/k)を与えられれば、
Figure 0006846442
はk+1個全ての値−a,−a+D,−a+2D,...,a(例えばk=100,a=10)について繰り返し、どのパラメータ値から最小の重み付けされた平均二乗誤差(式(12)を参照)が得られるかを決定することで、算出される。
逆再構成
順方向再構成関数fj()を与えられれば、(式(10)または(12))から例えば
Figure 0006846442
エンコーダは、デコーダが逆再構成を適用することを可能にするために、以下のように様々な選択肢を有する。
・fj()の定義(例えば多項式係数群および自身の次数KF)を送信し、デコーダにその逆関数
Figure 0006846442
を復元させる

Figure 0006846442
を生成し、
Figure 0006846442
の表現を、1つの多項式として、あるいは複数の二次多項式の組として送信する
・ルックアップテーブルを生成して送信する
例えば、[0 1)間のM個の均一にサンプリングされた点を与えられたとき、
Figure 0006846442
とし、ここでm=0,1,…,M−1とする。再構成器ユニットは、
1.m=0,1,…,M−1について
Figure 0006846442
を生成してもよく
2.m=0,1,…,M−1について逆スケーリング値
Figure 0006846442
を生成してもよく
3.サンプル
Figure 0006846442
に曲線フィッティングを行うことにより、次数KBの多項式を得てもよく:
Figure 0006846442
4.KBおよび
Figure 0006846442
パラメータを、再構成化ビットストリームとともにメタデータして埋め込んでもよい。
式(3)〜(4)より、デコーダにおいて、逆再構成は
Figure 0006846442
によって与えられる。
テストにおいて、KB=6により非常に良く表現できた。KB>2のとき、2つ以上の二次多項式を用いて近似式(15)を決定してもよい。また、式(15)において、復元されたルマ成分
Figure 0006846442
ならびにルマおよびクロマ成分のクロス乗積の両方に基づいて、クロマ成分を生成する。2015年11月2日に出願されたKlaas H.Schueuerらの米国仮出願Ser.No.62/249,474、「Layered representation and delivery of high dynamic range video」(2016年11月1日にPCT/US2016/059862としても出願)(この出願の開示内容を全て本願に援用する)に記載されるように、既存のいくつかのHDRデコーダ実装(例えばDolby社が提供するHDR Dolby Visionデコーディング)において、予測されたルマまたはクロマ成分に関する予測関数は、ルマおよびクロマ値の両方の組み合わせとしても表現され得る。この表現は、多変量・重回帰(MMR)表現と呼ばれる。例えば、一実施形態において、三次MMR表現は、
Figure 0006846442
と表現され得る。ここで、k=0,1,…,9についてmjkは、MMRモデルの係数を表す。
式(15)および(16)を与えられたとき、所与のKB(例えばKB=3)に対し、βjk係数ならびに再構成化ルマおよびクロマデータ値に関して、mjk係数について容易に解くことができる。例えば、式(15)を行列ベクトル形式
Figure 0006846442
で表現するとする。ここで、
Figure 0006846442
は、フレームjにおけるP画素のPx1ベクトル、
Figure 0006846442
はPx(KB+2)のデータ行列(data matrix)、そして
Figure 0006846442
は(KB+2)x1ベクトルである。式(16)は、
Figure 0006846442
と表現することもできる。ここで、
Figure 0006846442
はPx1ベクトルであり、
Figure 0006846442
はPx10データ行列であり、
Figure 0006846442
は10x1ベクトルである。式(17)および(18)は、同じ復元された値を表すため、
Figure 0006846442
を与えられたとき、
Figure 0006846442
ただし
Figure 0006846442
は、10x(KB+2)行列である。
実際において、全フレームについて
Figure 0006846442
を算出することはリアルタイム処理能力を超えるかもしれないため、「半固定」変換行列を用いてもよい。このとき、例えば、サンプリングされたフレームを用いて算出された
Figure 0006846442
および
Figure 0006846442
行列の移動平均を用いて、半固定行列は一時的に更新される。
図5Aは、一実施形態における、クロマ再構成プロセス(500A)の一例を提供する。HDR入力(117)を与えられると、ルマ再構成(505)の後、ブロック(510)が、最大スケールファクタ群
Figure 0006846442
と、オプションとしてルマに基づく重みを算出する
Figure 0006846442
(例えば式(5〜6)を用いて)。これらのデータはブロック515および520に渡されて、ここで、あるリファレンス再構成関数(fr())が与えられたときに、順方向再構成関数(fj())が決定される。順方向再構成関数は、当該分野において公知の任意の曲線フィッティング近似法を用いて(例えば式(10〜12)を用いて)算出され得る。または、2つ以上のクロス点を用いたより高速だが正確さに劣る技術を利用してよもよい。
クロマ再構成関数fj()を与えられると、再構成ユニット(535)を用いてクロマ再構成されたデータ(537)を生成する(例えば、入力再構成化ルマデータ(507)と入力HDRクロマデータ(117−CbCr)との両方の関数として式(2)を用いて)。順方向クロマ再構成関数fj()を用い、再構成器(500A)は、ステップ(525)および(530)において対応する逆再構成関数(gj())を生成する。逆再構成関数に関連するメタデータ(532)は、ブロック(530)によって生成される。再構成化ルマデータ(507)、再構成化クロマデータ(537)、およびメタデータ(532)は次に、下流へと渡され(例えば映像エンコーダに(例えば120)など)、さらなる処理を受ける(例えば圧縮など)。
モバイルプラットフォーム
携帯電話、タブレット、その他のポータブル機器などのモバイルプラットフォームにおいて、演算リソースは限られている。一実施形態において、図5Bに示すように、元のクロマ再構成プロセス(例えば500A)を、最良の順方向再構成関数(例えばステップ520)の選択、および逆再構成関数(ステップ525および530)に関連したメタデータの生成の両方について、なるべく予め算出されたルックアップテーブル(LUT)に依拠するように変更する(例えば500Bを参照)。
図2に示すように、実際においてリファレンススケーリング係数rmの値は、範囲[rmin,rmax](例えば[0.49,3.02]内に収まっている。実際において、
Figure 0006846442
の最低値は1未満であることはない。もし
Figure 0006846442
ならば、クリッピングの危険性はなく、リファレンス再構成関数fr()が常に選ばれる。したがって、実際において、fj()関数の出力は、常に範囲[1.0,rmax]にある。一実施形態において、この範囲は、中央値(mid−point)が
Figure 0006846442
と表されるような、N個の均一な区間に量子化され得る。図2のx軸を、[0,1)内のM個のxn値で表わされるものとするならば、各対(xi,yj),i=0,1,M−1、ならびにj=0,1,N−1は、出力再構成関数についての可能な第2の(B)クロス点(例えば425)と考えられ得る。もしそのような再構成関数をαk係数(k=0,1,…,KF+1)を有するKF次の多項式を用いて表現することができるならば、全ての可能な順方向再構成多項式を表す、NxMx(KF+1)ルックアップテーブルを構築することができる。一例として図6は、xi=0.25についての再構成関数(例えば610−0)および、yjの4つの異なる値(605)を示す。yj>fr(0.25)については、関数は算出されないことに留意されたい。
したがって、ルックアップテーブルα(i,j,k)(540)を生成するために、以下のプロセスを用い得る。すなわち、
Figure 0006846442
入力データに順方向再構成を行うために:
a)以下を解くことにより、現フレームjのBクロス点のx座標を生成する
Figure 0006846442
b)列Tにおける
Figure 0006846442
に最も近い
Figure 0006846442
値(あるいはBクロス点のy座標)を見出す:
Figure 0006846442
c)係数LUTエントリから、全てのk=0,1,…,KFについて、再構成フィルタのためのKF+1係数群を、
Figure 0006846442
として抽出する
d)再構成関数
Figure 0006846442
を適用する。ここで、
Figure 0006846442
である。
α(i,j,k)を作成するために用いられる順方向再構成関数の組が与えられれば、前述の技術を適用することで、対応する逆再構成関数の組を生成し得、これにより対応するβ(i,j,k)LUTを生成し得る。このように、各Bクロス点(n*,T)について、β(i,j,k)LUTは、βjkまたはmjk係数を出力し得る。
このように、モバイルプラットフォームに対しては、クロマ再構成プロセス(500B)は以下のステップを含む:
a)α(i,j,k)(540)およびβ(i,j,k)(545)ルックアップテーブルを生成する。これらのLUTは、オフラインあるいはデバイスのブート後に予め算出されたものであってもよく、再構成プロセスの開始(例えばHDR映像シーケンスをキャプチャして符号化すること)以前に、エンコーダにとり利用可能になっている。
b)入力(117)を与えられて、
Figure 0006846442
値および対応する最大スケール
Figure 0006846442
値(式(5〜6)を参照)を算出する。
c)再構成関数の第2の(B)固定点、例えば
Figure 0006846442
を決定する。
d)点B
Figure 0006846442
を、α(i,j,k)LUTへのインデックス入力として用い、順方向再構成関数の係数を生成する。
e)α(i,j,k)LUTからの係数を適用して順方向再構成を行い、クロマ再構成された信号(537)を生成する。
f)点B
Figure 0006846442
を、β(i,j,k)LUTへのインデックスとして用い、逆再構成関数の係数を生成する。抽出された逆再構成関数の係数を、メタデータとして送信する。
コンピュータシステム実装例
本発明の実施形態は、コンピュータシステム、電子回路およびコンポーネントで構成されたシステム、マイクロコントローラ、フィールドプログラマブルゲートアレイ(FPGA)または他のコンフィギュラブルまたはプログラマブルロジックデバイス(PLD)、離散時間またはデジタル信号プロセッサ(DSP)、特定用途向けIC(ASIC)などの集積回路(IC)デバイス、および/または、このようなシステム、デバイスまたはコンポーネントを1つ以上含む装置、を用いて実施し得る。このコンピュータおよび/またはICは、本明細書に記載のようなエンハンストダイナミックレンジを有する画像のクロマ再構成に関する命令を行い、制御し、または実行し得る。このコンピュータおよび/またはICは、本明細書に記載のクロマ再構成プロセスに関する様々なパラメータまたは値のいずれを演算してもよい。画像およびビデオ実施形態は、ハードウェア、ソフトウェア、ファームウェア、および、その様々な組み合わせで実施され得る。
本発明の特定の態様は、本発明の方法をプロセッサに行わせるためのソフトウェア命令を実行するコンピュータプロセッサを含む。例えば、ディスプレイ、エンコーダ、セットトップボックス、トランスコーダなどの中の1つ以上のプロセッサは、そのプロセッサがアクセス可能なプログラムメモリ内にあるソフトウェア命令を実行することによって、上記のようなHDR画像のクロマ再構成に関する方法を実装し得る。本発明は、プログラム製品形態で提供されてもよい。このプログラム製品は、データプロセッサによって実行された時に本発明の方法をデータプロセッサに実行させるための命令を含む1セットの、コンピュータ読み取り可能な信号を格納する任意の非一時的媒体を含み得る。本発明によるプログラム製品は、様々な形態をとり得る。例えば、このプログラム製品は、フロッピーディスク、ハードディスクドライブを含む磁気データ記憶媒体、CD ROM、DVDを含む光学データ記憶媒体、ROM、フラッシュRAMなどを含む電子データ記憶媒体、などの物理的媒体を含み得る。このプログラム製品上のコンピュータ可読信号は、任意に、圧縮または暗号化されていてもよい。
上記においてあるコンポーネント(例えば、ソフトウェアモジュール、プロセッサ、アセンブリ、デバイス、回路など)に言及している場合、そのコンポーネントへの言及(「手段」への言及を含む)は、そうでないと明記されている場合を除いて、当該コンポーネントの機能を果たす(例えば、機能的に均等である)あらゆるコンポーネント(上記した本発明の実施形態例に出てくる機能を果たす開示構造に対して構造的に均等ではないコンポーネントも含む)を、当該コンポーネントの均等物として、含むものと解釈されるべきである。
均等物、拡張物、代替物、その他
効率的なHDR画像のクロマ再構成に関する実施形態例を上述した。この明細書中において、各実装毎に異なり得る多数の具体的な詳細に言及しながら本発明の実施形態を説明した。従って、本発明が如何なるものかおよび出願人は本発明が如何なるものであると意図しているかについての唯一且つ排他的な指標は、後の訂正を含む、これら請求項が生じる具体的な形態の、本願から生じる1組の請求項である。当該請求項に含まれる用語に対して本明細書中に明示したあらゆる定義が、請求項内で使用される当該用語の意味を決定するものとする。よって、請求項に明示的に記載されていない限定事項、構成要素、特性、特徴、利点または属性は、いかなる形であれ請求の範囲を限定するものではない。従って、本明細書および図面は、限定的ではなく、例示的であると認識されるべきものである。
いくつかの実施形態において、本方法は、リファレンス再構成関数および最大スケールファクタ群に基づき、順方向再構成関数を生成するステップを含み得る。例えば、前記順方向再構成関数を生成することは、前記最大スケールファクタ群を用いて前記リファレンス再構成関数を調節することを含み得る。例えば、前記リファレンス再構成関数は、メモリまたはネットワーク上のロケーションから得られた既定の関数であってもよい。
本発明の様々な局面は、以下の列挙実施形態例(enumerated example embodiment:EEE)から理解され得る。
EEE1.
プロセッサを用いた適応的なクロマ再構成のための方法であって、
ルマ成分および1つ以上のクロマ成分についての画素値を有する入力画像(117)に、プロセッサを用いてアクセスする工程と、
前記入力画像のルマ成分の画素値群に基づいて、ルマ再構成化画像(507)を生成する工程と、
再構成化ルマ値群をリファレンスクロマスケールファクタ群にマッピングするリファレンス再構成関数に、アクセスする工程と、
前記入力画像のクロマ成分に対して:
前記ルマ再構成化画像中の画素値群の範囲を、2つ以上の階級に分割する工程と、
各階級について、各階級における前記ルマ再構成化画像の画素群に対応するクロマ画素値群に基づき、最大スケールファクタを生成する工程(510)と、
前記リファレンス再構成関数および最大スケールファクタ群に基づいて順方向再構成関数を生成する工程であって、前記順方向再構成関数は、再構成化ルマ値群を順方向クロマスケールファクタ群にマッピングする工程(520)と、
前記クロマ画素値群、前記順方向再構成関数、および前記ルマ再構成化画像中の対応する画素値群に基づいて、前記クロマ成分についての再構成化クロマ画素値群(537)を生成する工程(535)と、
を包含する、方法。

EEE2.
前記順方向再構成関数に基づいて、逆再構成関数を生成する工程と、
前記逆再構成関数を特徴付けるパラメータを生成する工程と、
前記逆再構成関数を特徴付けるパラメータに基づいて、メタデータを生成し出力する工程と、
をさらに包含する、EEE1に記載の方法。

EEE3.
各階級につき、その階級におけるルマ再構成化画像の画素に対して、前記最大スケールファクタは、前記階級における対応するクロマ値群の関数のtパーセンタイル値に基づいて算出される、
EEE1に記載の方法。

EEE4.
[0 1)に正規化された画素値群について、m番目の階級に対する前記最大スケールファクタを生成する工程は、
Figure 0006846442

を算出することを包含し、ここでMは階級の数であり、
Figure 0006846442
はm番目の階級を表し、
Figure 0006846442
は前記ルマ再構成化画像におけるi番目の画素を表し、
Figure 0006846442
は前記入力画像(j)の前記クロマ成分についての対応するクロマ画素を表し、ηは重み付け係数であり、qmaxは固定値であり、pt(x)は区間[0,100]におけるベクトルxの値のtパーセンタイル値を返す、
EEE3に記載の方法。

EEE5.
t=100であり、ηは0.85と0.95の間であるか、またはη =1かつtは95%と99%の間である、
EEE4に記載の方法。

EEE6.
前記入力画像(j)に対して前記順方向再構成関数
Figure 0006846442
を生成する工程は、
Figure 0006846442
を算出することを包含し、ここで条件として、
Figure 0006846442
であり、ここでMは階級の数であり、
Figure 0006846442
はm番目の階級についての最大スケールファクタを表し、
Figure 0006846442
であり、ここでfr()は前記リファレンス再構成関数を表し、
Figure 0006846442
は前記ルマ再構成化画像におけるi番目の画素を表し、
Figure 0006846442
であり、ここでKFは前記順方向再構成関数の多項式の次数を表す、
EEE3に記載の方法。

EEE7.
前記順方向再構成関数
Figure 0006846442
を生成する工程は、
Figure 0006846442
を算出することを包含し、ここで条件として、
Figure 0006846442
であり、ここで
Figure 0006846442
は重みである、
EEE6に記載の方法。

EEE8.
m番目の階級について、重み
Figure 0006846442
は、m番目の階級における前記ルマ再構成化画像の画素の数を表す、
EEE7に記載の方法。

EEE9.
前記順方向再構成関数
Figure 0006846442
は、前記リファレンス再構成関数の開始点と前記順方向再構成関数がクロスする第2の点とに基づいて生成され、前記第2の点は、前記リファレンス再構成関数未満であるすべての最大スケール値の値が、前記リファレンス再構成関数から最大の距離を有するような座標に対応する、
EEE7に記載の方法。

EEE10.
第2の点
Figure 0006846442
を算出することは、
Figure 0006846442
を算出することを包含する、
EEE9に記載の方法。

EEE11.
[0 1)に正規化された画素値群について、前記入力画像(j)の色成分(u)に対して前記再構成化クロマ値群
Figure 0006846442
を生成する工程は、
Figure 0006846442
を算出することを包含し、ここで
Figure 0006846442
は、前記再構成化ルマ画像の画素
Figure 0006846442
に対する前記順方向再構成関数の出力を表し、
Figure 0006846442
は、前記入力画像の色成分に対する対応するクロマ画素を表す、
EEE1に記載の方法。

EEE12.
前記逆再構成関数を特徴付ける前記パラメータは、予測関数についての三次多変量・重回帰表現のシンタックスに合致するように生成される、EEE2に記載の方法。

EEE13.
前記順方向再構成関数を生成する工程(520)は、
前記順方向再構成関数の所望のクロス点を特徴付ける(xT,yn*)座標を算出する工程であって、ここで前記xT座標は、前記リファレンス再構成関数未満である最大スケール値群の値が、前記リファレンス再構成関数から最大の距離を有するような再構成化ルマ値に対応する、工程と、
前記(xT,yn*)点座標と、複数の順方向再構成関数のための多項式係数群を含む第1のルックアップテーブルとに基づき、前記順方向再構成関数の多項式係数群を生成する工程と、
を包含する、EEE3に記載の方法。

EEE14.
前記(xT,yn*)座標を算出することは、
Figure 0006846442
を算出することであって、ここでmはm番目の階級を表し、
Figure 0006846442
はm番目の階級についての最大スケールファクタを表し、
Figure 0006846442
であり、ここでfr()は前記リファレンス再構成関数を表し、Mは階級の合計数を表し、
Figure 0006846442
であり、ここで
Figure 0006846442
は、範囲[1.0,rmax]がN個の区間に分割されたときのn番目の区間の中央を表し、ここでrmaxは前記リファレンス再構成関数の最大値を表している、
EEE13に記載の方法。

EEE15.
前記(xT,yn*)点座標と、複数の逆再構成関数のための多項式係数群を含む第2のルックアップテーブルとに基づき、逆再構成関数のパラメータを生成する工程と、
前記逆再構成関数を特徴付けるパラメータに基づいて、メタデータを生成し出力する工程と、
をさらに包含する、EEE13に記載の方法。

EEE16.
プロセッサを用いた適応的なクロマ再構成のための方法であって、
ルマ成分および1つ以上のクロマ成分を持つ画素値群を有する入力画像(117)に、プロセッサを用いてアクセスする工程と、
入力ルマ画素値群をリファレンスクロマスケールファクタ群にマッピングするリファレンス再構成関数に、アクセスする工程と、
前記入力画像のクロマ成分に対して:
前記ルマ画素値群の範囲を、2つ以上の階級に分割する工程と、
各階級について、各階級における前記ルマ画素値群に対応するクロマ画素値群に基づき、最大スケールファクタを生成する工程(510)と、
前記リファレンス再構成関数および前記最大スケールファクタ群に基づいて順方向再構成関数を生成する工程であって、前記順方向再構成関数は、ルマ画素値群を順方向クロマスケールファクタ群にマッピングする工程(520)と、
前記クロマ画素値群、前記順方向再構成関数、および前記対応するルマ画素値群に基づいて、前記クロマ成分についての再構成化クロマ画素値群(537)を生成する工程(535)と、
を包含する、方法。

EEE17.
プロセッサを備え、EEE1〜16のいずれかに記載の方法を実行するように構成された、装置。

EEE18.
EEE1〜16に記載の方法を実行するためのコンピュータ実行可能な命令を格納した、非一時的なコンピュータ読み取り可能な記憶媒体。

Claims (12)

  1. ハイダイナミックレンジ(HDR)画像の、プロセッサを用いた適応的なクロマ再構成のための方法であって、
    ルマ成分および1つ以上のクロマ成分についての画素値を有するHDR入力画像に、前記プロセッサを用いてアクセスする工程と、
    前記入力画像のクロマ成分に対して:
    前記HDR入力画像の前記ルマ成分または前記HDR入力画像の再構成化ルマ成分のいずれかの画素値群を、2つ以上の階級に区分する工程と、
    各階級について、各階級のそれぞれのルマまたは再構成化ルマ画素値群に対応する前記クロマ画素値群に基づき、最大スケールファクタを生成する工程と、
    リファレンス再構成関数および前記最大スケールファクタ群に基づいて、順方向再構成関数を生成する工程であって、前記順方向再構成関数は、ルマ画素値群または再構成化ルマ画素値群のいずれかを順方向クロマスケールファクタ群にマッピングし、これに相応して前記リファレンス再構成関数はルマ画素値群または再構成化ルマ画素値群をリファレンスクロマスケールファクタ群にマッピングする、工程と、
    前記クロマ画素値群、前記順方向再構成関数、および前記HDR入力画像の前記対応するルマ画素値群または再構成化ルマ画素値群に基づいて、前記クロマ成分についての再構成化クロマ画素値群を生成する工程と、
    を包含し、
    各階級につき、前記階級のそれぞれのルマ画素値群または再構成化ルマ画素値群に対して、前記最大スケールファクタは、前記階級における対応するクロマ値群の関数のt番目のパーセンタイル値に基づいて算出され、
    前記HDR入力画像jに対して前記順方向再構成関数
    Figure 0006846442
    を生成する工程は、
    Figure 0006846442
    を算出することを包含し、ここで条件として、
    Figure 0006846442
    であり、ここでMは階級の数であり、
    Figure 0006846442
    はm番目の階級についての最大スケールファクタを表し、
    Figure 0006846442
    であり、ここでf r ()は前記リファレンス再構成関数を表し、
    Figure 0006846442
    は前記HDR入力画像の前記各ルマ成分または再構成化ルマ成分のi番目の画素を表し、
    Figure 0006846442
    であり、ここでK F は前記順方向再構成関数の多項式の次数を表し、
    [0 1)に正規化された画素値群について、前記HDR入力画像(j)の色成分(u)に対して前記再構成化クロマ値群
    Figure 0006846442
    を生成する工程は、
    Figure 0006846442
    を算出することを包含し、ここで
    Figure 0006846442
    は、前記HDR入力画像のi番目の画素の前記各ルマ成分または再構成化ルマ成分の画素値
    Figure 0006846442
    に対する前記順方向再構成関数の出力を表し、
    Figure 0006846442
    は、前記HDR入力画像のi番目の画素の色成分に対する対応するクロマ画素値を表す、
    方法。
  2. 前記順方向再構成関数に基づいて、逆再構成関数を生成する工程と、
    前記逆再構成関数を特徴付けるパラメータ群を生成する工程と、
    前記逆再構成関数を特徴付ける前記パラメータ群に基づいて、メタデータを生成し出力する工程と、
    をさらに包含する、請求項1に記載の方法。
  3. [0 1)に正規化された画素値群について、m番目の階級に対する前記最大スケールファクタを生成する工程は、
    Figure 0006846442
    を算出することを包含し、ここでMは階級の数であり、
    Figure 0006846442
    は前記HDR入力画像jについてのm番目の階級を表し、
    Figure 0006846442
    は前記HDR入力画像jの前記各ルマ成分または再構成化ルマ成分のi番目の画素を表し、
    Figure 0006846442
    は前記HDR入力画像jの前記クロマ成分についての対応するクロマ画素を表し、ηは重み付け係数であり、qmaxは固定値であり、pt(x)はベクトルxの値のt番目のパーセ
    ンタイル値を返し、オプションとして、t=100かつηは0.85と0.95の間であるか、またはη =1かつtは95と99の間である、請求項に記載の方法。
  4. 前記順方向再構成関数
    Figure 0006846442
    を生成する工程は、
    Figure 0006846442
    を算出することを包含し、ここで条件として、
    Figure 0006846442
    であり、ここで
    Figure 0006846442
    は前記HDR入力画像jについてのm番目の階級に対する重みである、請求項に記載の方法。
  5. m番目の階級について、重み
    Figure 0006846442
    は、m番目の階級における前記HDR入力画像jの前記各ルマ成分または再構成化ルマ成分の画素値の数に比例する、請求項に記載の方法。
  6. 前記順方向再構成関数
    Figure 0006846442
    は、前記リファレンス再構成関数の開始点と、前記順方向再構成関数がクロスする第2の点とに基づいて生成され、前記第2の点は、前記リファレンス再構成関数未満であるすべての最大スケール値の値が、前記リファレンス再構成関数から最大の距離を有するような座標に対応し、またオプションとして、
    前記第2の点
    Figure 0006846442
    を算出することは、
    Figure 0006846442
    を算出することを包含する、請求項に記載の方法。
  7. 前記逆再構成関数を特徴付ける前記パラメータは、予測関数についての三次多変量・重回帰表現のシンタックスに合致するように生成される、請求項に記載の方法。
  8. 前記順方向再構成関数を生成する工程は、
    前記順方向再構成関数の所望のクロス点を特徴付ける(xT,yn*)座標を算出する工
    程であって、ここで前記xT座標は、前記リファレンス再構成関数未満である最大スケー
    ル値群の値が、前記リファレンス再構成関数から最大の距離を有するような各ルマ画素値または再構成化ルマ画素値に対応する、工程と、
    前記(xT,yn*)点座標と、複数の順方向再構成関数のための多項式係数群を含む第
    1のルックアップテーブルとに基づき、前記順方向再構成関数の多項式係数群を生成する工程と、
    を包含する、請求項1から7のいずれかに記載の方法。
  9. 前記(xT,yn*)座標を算出することは、
    Figure 0006846442
    を算出することを包含し、ここでmはm番目の階級を表し、
    Figure 0006846442
    はm番目の階級についての最大スケールファクタを表し、
    Figure 0006846442
    であり、ここでfr()は前記リファレンス再構成関数を表し、Mは階級の合計数を表し、
    Figure 0006846442
    であり、ここで
    Figure 0006846442
    は、範囲[1.0,rmax]がN個の区間に分割されたときのn番目の区間の中央を表し、ここでrmaxは前記リファレンス再構成関数の最大値を表している、請求項に記載の方法。
  10. 前記(xT,yn*)点座標と、複数の逆再構成関数のための多項式係数群を含む第2の
    ルックアップテーブルとに基づき、逆再構成関数のパラメータを生成する工程と、
    前記逆再構成関数を特徴付けるパラメータに基づいて、メタデータを生成し出力する工程と、
    をさらに包含する、請求項8または9に記載の方法。
  11. プロセッサを備え、請求項1から10のいずれかに記載の方法を実行するように構成された、装置。
  12. 請求項1から10に記載の方法を実行するためのコンピュータ実行可能な命令を含むコンピュータプログラム
JP2018560837A 2016-05-19 2017-05-17 ハイダイナミックレンジ画像のためのクロマ再構成 Active JP6846442B2 (ja)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201662338638P 2016-05-19 2016-05-19
EP16170446.5 2016-05-19
EP16170446 2016-05-19
US62/338,638 2016-05-19
PCT/US2017/033056 WO2017201139A1 (en) 2016-05-19 2017-05-17 Chroma reshaping for high dynamic range images

Publications (2)

Publication Number Publication Date
JP2019523578A JP2019523578A (ja) 2019-08-22
JP6846442B2 true JP6846442B2 (ja) 2021-03-24

Family

ID=67694678

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018560837A Active JP6846442B2 (ja) 2016-05-19 2017-05-17 ハイダイナミックレンジ画像のためのクロマ再構成

Country Status (2)

Country Link
US (1) US10645403B2 (ja)
JP (1) JP6846442B2 (ja)

Families Citing this family (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10701404B2 (en) 2016-08-30 2020-06-30 Dolby Laboratories Licensing Corporation Real-time reshaping of single-layer backwards-compatible codec
WO2019101373A1 (en) * 2017-11-24 2019-05-31 Thomson Licensing Method and apparatus for colour correction during hdr to sdr conversion
KR20210118400A (ko) 2019-02-01 2021-09-30 베이징 바이트댄스 네트워크 테크놀로지 컴퍼니, 리미티드 비디오 코딩을 위한 루마 종속적 크로마 잔차 스케일링의 구성
CN113475079A (zh) 2019-02-01 2021-10-01 北京字节跳动网络技术有限公司 环路整形和帧内块复制之间的相互作用
CN113475072B (zh) * 2019-03-04 2023-12-15 北京字节跳动网络技术有限公司 视频处理中滤波信息的信令
WO2020182091A1 (en) * 2019-03-08 2020-09-17 Beijing Bytedance Network Technology Co., Ltd. Reshaping model in video processing
CN117499644A (zh) 2019-03-14 2024-02-02 北京字节跳动网络技术有限公司 环路整形信息的信令和语法
WO2020192614A1 (en) 2019-03-23 2020-10-01 Beijing Bytedance Network Technology Co., Ltd. Restrictions on adaptive-loop filtering parameter sets
WO2020211863A1 (en) 2019-04-18 2020-10-22 Beijing Bytedance Network Technology Co., Ltd. Selective use of cross component mode in video coding
CN113711610B (zh) 2019-04-23 2024-04-16 北京字节跳动网络技术有限公司 降低跨分量依赖性的方法
KR102641796B1 (ko) 2019-05-08 2024-03-04 베이징 바이트댄스 네트워크 테크놀로지 컴퍼니, 리미티드 교차-성분 코딩의 적용가능성에 대한 조건들
WO2020259427A1 (en) 2019-06-22 2020-12-30 Beijing Bytedance Network Technology Co., Ltd. Syntax element for chroma residual scaling
JP7460748B2 (ja) 2019-07-07 2024-04-02 北京字節跳動網絡技術有限公司 クロマ残差スケーリングのシグナリング
KR20220058958A (ko) * 2019-09-17 2022-05-10 인터디지털 브이씨 홀딩스 프랑스 에스에이에스 루마 맵핑 기울기 값들에 추가될 보정 값을 예측하는 크로마 잔차 스케일링
US11425405B2 (en) * 2019-11-15 2022-08-23 Qualcomm Incorporated Cross-component adaptive loop filter in video coding

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7058234B2 (en) 2002-10-25 2006-06-06 Eastman Kodak Company Enhancing the tonal, spatial, and color characteristics of digital images using expansive and compressive tone scale functions
IN2015KN02510A (ja) 2013-02-21 2015-09-11 Dolby Lab Licensing Corp
US10666990B2 (en) * 2015-01-30 2020-05-26 Interdigital Vc Holdings, Inc. Method and device for matching colors between color pictures of different dynamic range
US10419762B2 (en) 2015-03-02 2019-09-17 Dolby Laboratories Licensing Corporation Content-adaptive perceptual quantizer for high dynamic range images
WO2017079132A1 (en) 2015-11-02 2017-05-11 Dolby Laboratories Licensing Corporation Layered representation containing crc codes and delivery of high dynamic range video
WO2017165494A2 (en) 2016-03-23 2017-09-28 Dolby Laboratories Licensing Corporation Encoding and decoding reversible production-quality single-layer video signals
US10542296B2 (en) * 2016-05-10 2020-01-21 Dolby Laboratories Licensing Corporation Chroma reshaping of HDR video signals

Also Published As

Publication number Publication date
US20190320191A1 (en) 2019-10-17
JP2019523578A (ja) 2019-08-22
US10645403B2 (en) 2020-05-05

Similar Documents

Publication Publication Date Title
JP6846442B2 (ja) ハイダイナミックレンジ画像のためのクロマ再構成
CN109416832B (zh) 高效的基于直方图的亮度外观匹配
US10419762B2 (en) Content-adaptive perceptual quantizer for high dynamic range images
CN109155853B (zh) 用于高动态范围图像的色度整形
CN108885783B (zh) 编码和解码可逆制作质量单层视频信号
US10032262B2 (en) Block-based content-adaptive reshaping for high dynamic range images
JP2021521517A (ja) ニューラルネットワークマッピングを用いるhdr画像表現
CN107771392B (zh) 用于高动态范围图像的实时内容自适应感知量化器
EP3281409A1 (en) In-loop block-based image reshaping in high dynamic range video coding
CN112106357A (zh) 端对端单层后向兼容编码流水线中的高保真度全参考和高效部分参考编码
JP7094451B2 (ja) 再構成関数の補間
WO2016172091A1 (en) Signal reshaping and coding in the ipt-pq color space
JP2020507958A (ja) ハイダイナミックレンジ映像を符号化するためのセグメントベース再構成
US10165275B2 (en) Content-adaptive reshaping for high dynamic range images
TWI812874B (zh) 張量乘積之b平滑曲線預測子
JP7037584B2 (ja) 効率的なエンド・ツー・エンドシングルレイヤー逆ディスプレイマネジメント符号化
CN108370446B (zh) 具有减小的内插误差的低复杂度查找表构造
RU2794137C1 (ru) Предсказатель b-сплайна тензорного произведения
WO2022011194A1 (en) Workload allocation and processing in cloud-based coding of hdr video

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20190522

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20200601

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20200630

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200924

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20210209

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20210301

R150 Certificate of patent or registration of utility model

Ref document number: 6846442

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250