JP2016529741A - エンハンストダイナミックレンジ信号の階層符号化のための適応的再構成 - Google Patents

エンハンストダイナミックレンジ信号の階層符号化のための適応的再構成 Download PDF

Info

Publication number
JP2016529741A
JP2016529741A JP2015563023A JP2015563023A JP2016529741A JP 2016529741 A JP2016529741 A JP 2016529741A JP 2015563023 A JP2015563023 A JP 2015563023A JP 2015563023 A JP2015563023 A JP 2015563023A JP 2016529741 A JP2016529741 A JP 2016529741A
Authority
JP
Japan
Prior art keywords
input
codeword
edr
function
chromaticity
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2015563023A
Other languages
English (en)
Other versions
JP6038360B2 (ja
Inventor
スゥ,グワン‐ミーン
アトキンス,ロビン
スコット ミラー,ジョン
スコット ミラー,ジョン
Original Assignee
ドルビー ラボラトリーズ ライセンシング コーポレイション
ドルビー ラボラトリーズ ライセンシング コーポレイション
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ドルビー ラボラトリーズ ライセンシング コーポレイション, ドルビー ラボラトリーズ ライセンシング コーポレイション filed Critical ドルビー ラボラトリーズ ライセンシング コーポレイション
Publication of JP2016529741A publication Critical patent/JP2016529741A/ja
Application granted granted Critical
Publication of JP6038360B2 publication Critical patent/JP6038360B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • H04N19/126Details of normalisation or weighting functions, e.g. normalisation matrices or variable uniform quantisers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/182Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a pixel
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/186Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a colour or a chrominance component
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/189Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding
    • H04N19/192Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding the adaptation method, adaptation tool or adaptation type being iterative or recursive
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • H04N19/36Scalability techniques involving formatting the layers as a function of picture distortion after decoding, e.g. signal-to-noise [SNR] scalability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/85Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/184Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being bits, e.g. of the compressed video stream

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

【解決手段】エンコーダは、レイヤ表現で符号化されるための入力エンハンストダイナミックレンジ(EDR)画像を受信する。入力画像は、ガンマ符号化されていてもよいし、1つ以上のビデオエンコーダでサポートされていないビット深度フォーマットを用いて知覚的符号化されていてもよい。入力画像を1つ以上の量子化レイヤに再マッピングし、これにより、利用可能なビデオエンコーダを用いた圧縮に適した出力符号語を生成する。線形および非線形マッピング関数のための最適関数パラメータを求めるアルゴリズムを説明する。あるマッピング関数に対して、逆方向マッピング関数を、ルックアップテーブルとしてデコーダに送信してもよいし、区分的多項式近似を用いて近似してもよい。色ズレを軽減するための逆方向マッピング関数および色度変換方式を表す多項式近似技術も説明する。【選択図】図3

Description

本願は、2013年6月17日出願の米国特許仮出願第61/836,044号、2014年3月12日出願の米国特許仮出願第61/951,914号、および、2014年5月23日出願の米国特許仮出願第62/002,631号に基づく優先権を主張するものであり、これらの出願の開示内容の全てを本願に援用する。
本願は、2014年3月25日出願の国際出願第PCT/US2014/031716号にも関連し得るものであり、この出願の開示内容の全てを本願に援用する。
本発明は、広義には、ビデオ画像に関する。より具体的には、本発明のある実施形態は、階層符号化および復号化のための、ハイまたはエンハンスト(enhanced)ダイナミックレンジを有する画像の適応的再構成(adaptive reshaping)に関する。
本明細書において、用語「ダイナミックレンジ」(DR)は、画像においてある範囲の強度(例えば、輝度、ルマ)(例えば、最暗部(黒)から最明部(白)まで)を知覚する人間の心理視覚システム(HVS)の能力に関連し得る。この意味では、DRはシーン−リファード(scene−referred)の強度に関する。DRはまた、ディスプレイデバイスが特定の幅を有する強度範囲を妥当にまたは近似的に描画する能力にも関連し得る。この意味では、DRは、ディスプレイ−リファード(display−referred)の強度に関する。本明細書中の任意の箇所において、ある特定の意味が特に明示的に指定されている場合を除いて、この用語はどちらの意味としても(例えば、区別なく)使用できるものとする。
本明細書において、ハイダイナミックレンジ(HDR)という用語は、人間の視覚システム(HVS)において14〜15桁ほどにわたるDR幅に関する。例えば、しっかりと順応した、実質的に正常(例えば、統計的な意味、バイオメトリック的な意味、または、眼科的な意味の1つ以上において)な人間は、約15桁にわたる強度範囲を有する。順応した人間は、ほんの少量の光子のうす暗い光源を知覚し得る。また、同じ人間が、砂漠、海または雪上における真昼の太陽の、目が痛くなるほどの明るい強度を知覚し得る(また、怪我をしないような短時間であるとしても太陽を見ることもできる)。ただし、この範囲は、「順応した人間」、例えば、そのHVSをリセットして調節する時間を経た人間に当てはまるものである。
これに対して、人間が、広範囲の強度範囲を同時に知覚し得るDRは、HDRに対して幾分端折られ得る。本明細書において、エンハンストダイナミックレンジ(EDR)または視覚ダイナミックレンジ(VDR)という用語は、個別にまたは区別なく、HVSによって同時に知覚可能なDRに関連し得る。本明細書において、EDRは、5〜6桁にわたるDRに関連し得る。従って、真のシーンリファードのHDRに対して幾分狭いものの、EDRは、広いDR幅を示す。
実際には、画像は、1つ以上の色成分(例えば、輝度Yおよび色差CbおよびCr)を有し、各色成分はnビット/ピクセルの精度で表される(例えば、n=8)。輝度ダイナミックレンジとビット深度は同じものではないが、しばしば相互に関連性がある。n≦8の画像(例えば、カラー24ビットJPEG画像)は標準的なダイナミックレンジの画像とされ、n>8の画像はエンハンストダイナミックレンジの画像とされる。EDRおよびHDR画像は、”Industrial Light and Magic”が開発したOpenEXRファイルフォーマットなどの高精度の(例えば、16ビット)浮動小数点フォーマットを用いて、保存および配信され得る。
ビデオ信号は、ビット深度、色空間、色域および解像度などの複数のパラメータによって特徴付けられる。最新のテレビおよびビデオ再生デバイス(例えば、ブルーレイプレーヤー)は、標準解像度(例えば、720×480i)および高精細(HD)(例えば、1920×1080p)を含む様々な解像度をサポートしている。超高精細(UHD)は、少なくとも3,840×2,160の解像度(「4K UHD」)を有し、7680×4320(「8K UHD」)まで上げられるオプションを有する次世代解像度フォーマットである。超高精細は、UltraHD、UHDTVまたはスーパーハイビジョンとも呼ばれることがある。本明細書において、UHDは、HD解像度よりも高い任意の解像度を指す。
新しいHDRまたはUHD符号化およびディスプレイ技術だけでなく、旧式の8ビットの再生デバイスとの下位互換性をサポートするために、上流側デバイスから下流側デバイスへとUHDおよびHDR(またはEDR)ビデオデータを送信する際に、複数フォーマットが用いられ得る。あるEDRストリームに対して、あるデコーダは、1セットの8ビットレイヤを用いて、コンテンツのHD SDRまたはEDRバージョンを再構築し得る。新型のデコーダは、従来の8ビットよりも高いビット深度で符号化された第2のセットのレイヤを用いて、コンテンツのUHD EDRバージョンを再構築し、それをより高性能なディスプレイ上に描画し得る。本願発明者も理解しているように、EDRビデオの符号化および配信のためにより向上した技術が望まれる。
本節に記載されている手法は、探求し得る手法ではあるが、必ずしもこれまでに着想または探求されてきた手法ではない。従って、特に反対の記載がない限り、本節に記載された手法のいずれも、本節に記載されているという理由だけで従来技術としての適格性を有すると考えるべきではない。同様に、特に反対の記載がない限り、1以上の手法に関して特定される問題が、本節に基づいて、いずれかの先行技術において認識されたことがあると考えるべきではない。
図1Aは、本発明のある実施形態による、EDR階層符号化のフレームワーク例を示す図である。 図1Bは、本発明のある実施形態による、EDR階層復号化のフレームワーク例を示す図である。 図2は、本発明のある実施形態による、関数パラメータaを決定する、べき関数に基づくEDR信号再構成関数の一例を示す図である。 図3は、本発明のある実施形態による、EDR入力の順方向構成関数の最適な指数を決定する処理例を示す図である。 図4は、本発明のある実施形態による、EDR符号語の順方向マッピングを決定する処理例を示す図である。 図5は、入力EDR符号語(vc)を、本発明のある実施形態に従って算出される、ブロックベースのスケーリング係数(k(vc))に中間マッピングする一例を示す図である。 図6は、本発明のある実施形態による、入力EDR符号語を最終出力である再構成済みシンボルにマッピングする一例を示す図である。 図7は、本発明のある実施形態に従って算出される、逆方向マッピングの一例を示す図である。 図8Aおよび図8Bは、本発明のある実施形態による色度範囲スケーリングの一例を示す図である。 図9は、本発明のある実施形態による、符号化および復号化パイプラインの一例を示す図である。
エンハンストダイナミックレンジ(EDR)を有するビデオ画像の階層符号化のための、適応的再構成技術を本明細書に説明する。以下の説明においては、便宜上、本発明を完全に理解できるように、多数の詳細事項を説明する。ただし、これらの詳細事項が無くても本発明を実施可能であることは明白であろう。他方、本発明の説明を不必要に煩雑にしたり、不明瞭にしたり、難読化したりしないように、周知の構造およびデバイスの細かな詳細までは説明しない。
同様の部材に同様の参照符号を付した添付図面の各図において、本発明のある実施形態を限定する事なく例示する。
概要
本明細書に記載の実施形態例は、効率的な階層符号化を行うための、ハイまたはエンハンストダイナミックレンジを有するビデオ画像の適応的再構成に関する。エンコーダは、レイヤ表現で符号化されるための入力エンハンストダイナミックレンジ(EDR)画像を受信する。入力画像は、ガンマ符号化されていてもよいし、利用可能なビデオエンコーダの1つ以上でサポートされていないビット深度フォーマットを用いて知覚的符号化されていてもよい。入力画像を1つ以上の量子化レイヤに再マッピングし、これにより、利用可能なビデオエンコーダを用いた圧縮に適した出力符号語を生成する。
ある実施形態において、再マッピングは、単一の関数パラメータを用いたべき関数に基づいている。入力EDR画像中の各ブロックについてブロックベースの複雑性尺度を算出し、その後、量子化画像における量子化に起因する歪みの量を評価することにより、最適な関数パラメータを求める技術を説明する。
別の実施形態においては、標準偏差のようなブロックベースの複雑性尺度と、ブロックベースの線形量子化モデル(各画像ブロックについて別々の最適な量子化器スケーラを求める)とを用いて、最適マッピングを生成する。この別々の最適スケーラを組み合わせることにより、各入力符号語について包絡線の傾きを求め、入力および出力符号語間の最適な順方向マッピング関数を包絡線の傾きに基づいて求める。逆方向マッピング関数を、ルックアップテーブルとしてデコーダに送信してもよいし、区分的多項式近似を用いて近似してもよい。
別の実施形態において、ある逆方向マッピングルックアップテーブルが与えられると、多項式近似技術を用いて逆方向マッピング関数が近似される。
デコーダにおいて、符号化ビットストリームレイヤを復号化することによって復号化ビデオレイヤを生成し、これら復号化ビデオレイヤを再結合して1つの復号化信号を生成する。そして、エンコーダの再構成(reshaping)またはマッピング関数を定義する受信パラメータが与えられると、復号化信号を逆方向マッピングして、これにより、エンコーダからデコーダに送信される元のEDR信号の推定結果を生成する。
別の実施形態においては、所望の白色点の座標が変換後の色度範囲の中心に概ねシフトされるように、入力ビデオ信号の色度色成分を変換してもよい。
ビデオ信号再構成および階層分解のためのフレームワーク例
階層符号化および復号化
HDTV、セットトップボックスまたはブルーレイプレーヤーのような既存のディスプレイおよび再生デバイスは、典型的に、最大1080pHD解像度(例えば、1920×1080 60フレーム/秒)までの信号をサポートしている。家庭用用途では、このような信号は、現在、典型的には色差成分が輝度成分よりも低い解像度を有するような輝度−色差色フォーマット(例えば、YCbCrまたはYUV4:2:0色フォーマット)で、各色成分について8ビット/ピクセルのビット深度を用いて典型的に圧縮される。8ビットの深度およびそれに対応する低ダイナミックレンジのために、これらの信号は典型的には、標準ダイナミックレンジ(SDR)を有する信号と呼ばれる。超高精細(UHD)などの新しいテレビ規格が開発される中、エンハンスト(enhanced)解像度および/またはエンハンストダイナミックレンジを用いて信号を符号化することが望まれ得る。
ビデオ画像は、典型的には、人間の視覚システムの特性を補うためにガンマ符号化される。例えば、ITU−R Rec 2020は、推奨されるUHDTV信号のガンマ符号化を定義している。EDR画像については、知覚量子化(PQ)は、従来のガンマ符号化よりも良い代替法であり得る。人間の視覚システムは、光レベルの増大に対して非常に非線形的に反応する。人間が刺激を見る能力は、その刺激の輝度、その刺激の大きさ、その刺激を構成する空間周波数、および、その刺激を見ている瞬間までに目が順応した輝度レベルに影響される。知覚的量子化器関数は、線形入力グレイレベルを、人間の視覚システムにおけるコントラスト感度閾値によりマッチした出力グレイレベルにマッピングする。PQマッピング関数の一例は、J.S.Millerらによる2012年12月06日出願の「Perceptual luminance nonlinearity−based image data exchange across different display capabilities」という表題のPCT出願シリアル番号第PCT/US2012/068212号(以下、「‘212出願」と呼ぶ)に記載されており、この出願の開示内容を全て本願に援用する。上記PCT出願において、ある固定刺激サイズに対して、それぞれの輝度レベル(即ち、刺激レベル)について、最高感度の適応レベルおよび最高感度の空間周波数(HVSモデルによる)に応じて、その輝度レベルにおける最小可視コントラストステップを選択する。物理的な陰極線管(CRT)装置の応答曲線を表しており、人間の視覚システムの応答の仕方に対して非常に大まかな類似性を偶然有し得る従来のガンマ曲線と比較して、‘212出願において決定されているPQ曲線は、比較的シンプルな関数モデルを用いながら人間の視覚システムの本当の視覚応答を模擬している。
本願にその開示内容が援用される2013年3月26日出願の「Encoding perceptually−quantized video content in multi−layer VDR coding」という表題の米国特許仮出願シリアル番号第61/805,388号(以下「‘388出願」と呼ぶ)(2014年3月25日にPCT/US2014/031716としても出願されている)において、発明者らは、2レイヤエンコーダを用いたPQ符号化EDR画像データの効率的な符号化および送信を行うための、画像再構成技術を記載している。本願は、シングルレイヤまたはマルチレイヤエンコーダの両方を用いた、EDRデータの符号化に適用可能な新規なマッピングまたは再構成技術を記載することによって‘388出願を発展させたものである。
図1Aは、本発明のある実施形態による、EDR階層符号化のフレームワーク例を示す。入力信号(102)は、ガンマまたはPQ符号化され得るEDRピクセル値を有する、ビデオフレームシーケンスを含む。システムは、少なくとも1つのベースレイヤ(BL)ビデオエンコーダ(120−0)を含み、合計L個の符号化レイヤに対して、1つ以上、最大L−1個のエンハンスメントレイヤ(EL)ビデオエンコーダ(120−1,120−L−1)を含み得る。例えば、L=2の場合、システムは、1つのデュアルレイヤエンコーダを含む。ビデオエンコーダ(120)は全て同じでもよく、または異なっていてもよく、MPEG−2、MPEG−4、part2、H.264(またはAVC)、H.265(またはHEVC)等のような既知の、または未来のビデオ圧縮用符号化フォーマットを実行する。さらに、あるレイヤのビデオエンコーダが、別のレイヤのビデオエンコーダとは異なるビット深度をサポートし得る。例えば、限定はしないが、実施形態は、以下の構成を有していてもよい。
・ 少なくとも10ビットのビット深度をサポートし、好ましくは12ビット以上をサポートする、シングルレイヤのHEVCエンコーダ。
・ デュアルレイヤエンコーダであって、両方のエンコーダが同じフォーマット(例えばH.264)を用いて符号化を行い、両方のエンコーダが同じまたは異なるビット深度(例えば8ビットおよび10ビット)をサポートするようなデュアルレイヤエンコーダ。
・ デュアルレイヤエンコーダであって、2つのエンコーダは異なる符号化フォーマットを用いて符号化を行い、それぞれが異なるビット深度(例えば8ビットおよび10ビット以上)をサポートし得るような、デュアルレイヤエンコーダ。
・ マルチレイヤエンコーダであって、少なくとも1つのエンコーダが8ビットMPEG−2エンコーダであり、少なくとも他方のエンコーダがHEVCまたはH.264エンコーダである、マルチレイヤエンコーダ。
ビデオエンコーダ(120)は、全て、単一のプロセッサまたは1つ以上のプロセッサによって実施され得る。
ある実施形態によれば、信号再構成モジュール(110)は、入力EDR信号(vと表記する)(102)を量子化して、最大サポートビット深度などのビデオエンコーダ(120)の特性により良く適合する、信号s(112)を得る。本明細書において、「再構成(reshaping)」、「量子化」および「(順方向)マッピング」の用語は、入力信号を第1のダイナミックレンジから(典型的には第1のダイナミックレンジよりも低い)第2のダイナミックレンジの出力信号へとマッピングする同様な機能を指し、互いに区別無く使用され得る。
lがl番目のレイヤビデオエンコーダ(120−l、l=0、1、2、...、L−1)が用いるビット深度を指すものとすると、各レイヤは、合計NT=N0+N1+...+NL-1個の符号語に対して、最大Nl=2Bl個の入力符号語をサポートできる。例えば、L=1(シングルレイヤ)およびB0=10の場合、210=1024個の量子化符号語が存在する。L=2(デュアルレイヤ)およびB0=B1=8の場合、28+28=512個の量子化符号語が存在する。L=2およびB0=10およびB1=8の場合、合計210+28=1280個の量子化符号語が存在する。よって、システムは、それぞれが独自のビット深度で動作する複数のビデオ符号化規格の、任意の組み合わせに対応し得る。
s=f(v)が信号再構成/量子化関数(110)を表すものとする。このような関数の例は詳しく後述する。再構成関数を特定するパラメータが、メタデータ信号(119)として含まれていてもよい。いくつかの実施形態において、メタデータ(119)はメタデータエンコーダ(125)によって符号化され、符号化メタデータ(127)は、適切な逆量子化および復号化のために、図1Bに示したようなデコーダに送信され得る。別の実施形態において、信号再構成(110)は、1群の信号再構成関数を含み、1つ以上のレイヤに対して、または1レイヤ内の1つ以上の色度成分に対して、別々の構成関数を用いてもよい。例えば、ある実施形態において、ベースレイヤ(l=0)の信号再構成関数は線形関数である一方で、第1のエンハンスメントレイヤ(l=1)の信号再構成関数は非線形関数または区分線形関数を含んでいてもよい。
レイヤ分解
ある実施形態において、量子化信号s(112)のピクセル値を、区分境界{pi、i=0、1、...、L}によって定義されるL個の区分に分割するものとする。ただし、p0は典型的にはsの最小値(例えば、p0=0)を表し、
Figure 2016529741
である。
例えば、L=1の場合、p0=0およびp1=N0である。このモジュールは、全符号語をベースレイヤに符号化する。
L=2の場合、p0=0、p1=N0、p2=N0+N1である。ある実施形態において、{p0、p1}間の符号語を有するピクセルはレイヤ0で符号化され、{p1、p2}間の符号語を有するピクセルはレイヤ1で符号化される。一般的に、L個のレイヤがあった場合、各レイヤlに対して、当該レイヤのslピクセルは、以下のように符号化される。
l=Clip3(s,pl,pl+1−1)−pl
l=0,1,2,…,L−1 (2)
ただし、d=Clip3(s,a,b)はクリッピング関数を表し、ここで、a≦s≦bであればd=sであり、s<aであればd=aであり、s>bであればd=bである。
レイヤ分解(115)後、ある実施形態においては、各レイヤsl(117−l、l=0、1、...、L−1)をビデオエンコーダ(120)でそれぞれ独立して符号化し、これにより、圧縮ビットストリーム(122)を生成してもよい。‘388出願において説明されているように、いくつかの実施形態において、図1Aに示すシステムを改変して、レイヤ間予測をも可能にしてもよい。そのような実施形態においては、予測器を用いて、l−1レイヤのピクセル値に基づいてl番目のレイヤのピクセル値を推定すればよく、その後、l番目のレイヤのピクセル値を直接符号化するのではなく、実値および予測値の間の残差を単に符号化して送信する。
いくつかの実施形態において、符号化ビットストリーム(122)、符号化メタデータ(127)および他のデータ(例えば、オーディオデータ)を多重化して単一のビットストリームにし、単一の多重化されたビットストリーム(図示せず)としてデコーダに送信してもよい。
図1Bは、本発明のある実施形態によるEDR階層復号化のフレームワーク例を示す。図1Bに示すように、オーディオ、ビデオおよび補助的なデータ(図示せず)を組み合わせ得る受信ビットストリームを多重分離した後、受信符号化ビットストリーム(122)をそれぞれビデオデコーダ(130)アレイに送る。デコーダ群(130)はエンコーダ群(120)に対応し、1つ以上の復号化ビデオ信号(132)を生成する。信号逆再構成(inverse reshaping)およびレイヤ結合器(140)ユニットを用いて、受信した階層信号を結合および逆再構成して信号(^付v)(142)(元のEDR信号(102)の推定結果を表す)を生成する。ある実施形態において、出力EDR信号(142)は以下のように生成され得る。
Figure 2016529741
ただし、f-1()は、信号再構成関数(110)の逆数(または逆数の近い近似値)を表し、(^付sl)は、元のsl信号(117)の非常に近い近似値を表す再構築されたレイヤ信号(132)を表す。図1Bに示すように、受信レイヤ間においてレイヤ間予測は無い。しかし、ビデオ符号化の分野において公知であるように、容易にこのシステムは拡張することができ、受信した残差信号およびレイヤ間予測を用いて(^付sl)信号を生成するデコーダとすることができる。
べき関数を用いたEDR信号再構成
‘388出願に記載のように、PQ符号化された信号について、ある実施形態においては、信号再構成関数(110)は以下のように表される。
Figure 2016529741
ただし、vLおよびvHは、入力EDR信号(102)について検討中のカラーチャンネルにおける最小値および最大値を表し、cLおよびcHは対応する最小および最大出力値を表す。例えば、ある実施形態においては、等式(1)に定義されるように、cL=0およびcH=pL−1である。αの値は一定であるが、フレーム毎に、シーン毎に、または、他の適切な基準に従って適応および変更してもよい。図2は、α<1についての等式(4)のべき再構築関数の一例を示す。ある実施形態においては、入力(112)がPQ符号化されている場合α>1であり、またそうではなく、入力(112)がガンマ符号化されている場合α<1である。
‘388出願には、あるブロック内のピクセルの標準偏差またはそのブロック内の最小と最大ピクセル値の差分に基づいて、ブロック複雑性尺度(metrics)(MEDR)を用いて、αの最適値を求める方法を記載した。これらの尺度に加えて、あるブロックの空間的または周波数特性のいずれかに基づいて他の複雑性尺度を適用することも可能である。例えば、MEDRは、ブロック内でのピクセルの分散、ブロックのDC値、または、そのピクセル値あるいはDCT係数の別の関数に対応していてもよい。
それぞれNブロックに区分された(例えば、各ブロックは8x8ピクセル)F枚のビデオフレームを含むビデオシーンについて考える。画像ブロックはオーバーラップしていてもよいが、好適な実施形態においてはオーバーラップしていない。図3は、一般化したブロック複雑性尺度MEDR(j,n)(例えば、限定はしないが、ブロック内のピクセル値の標準偏差)に基づいて最適なαを算出する処理を示す。
図3に示すように、そのシーン内の全フレームについてブロック毎にMEDR(j,n)を算出する工程(305)の後、工程(310)において、ある基準(例えば、MEDR(j,n)>T 但し、Tは予め定められた閾値(例えば0)である)を満たす全画像ブロックを含む1つの集合(set)Φjを構築する。
工程(315)、(320)および(325)は、所定の範囲(例えば、MIN_α≦αj≦MAX_α)内の様々なαj値について算出されるループ(327)を構成する。例えば、αjは始めに1に等しくしておき、その後、元のEDRビデオデータがどのように符号化されているかによって増減させてもよい。例えば、PQ符号化されたデータの場合には増加し、ガンマ符号化されたデータの場合には低減してもよい。工程(320)においては、与えられたαjおよび等式(4)を用いて、入力データEDRを量子化し、量子化された各ブロックについて新たな尺度MLD(j,n,αj)を算出してもよい。いくつかの実施形態において、複雑性尺度MLDは複雑性尺度MEDRと同一である。他の実施形態においては、これら2つの複雑性尺度は異なっていてもよい。入力EDRデータを量子化する程、量子化信号(112)の特性はより変化する。理想的には、量子化(110)がなるべく入力を歪ませない方がよい。工程(325)においては、量子化による歪みの尺度を適用して、選択αj値が最適かどうかを突き止めてもよい。例えば、ある実施形態において、
Figure 2016529741
の場合に、αjを最適として選択してもよい。ただし、Tσはまた別の所定の閾値(例えば、Tσ=0)
あるシーンの全ブロックを量子化した後、工程(330)において総合的に最適なアルファ値を選択する。例えば、ある実施形態において、α>1の場合、総合的に最適なαは、全最適αj値に対して最小であるαとして選択する。同様に、α<1の場合、総合的に最適なαは、全最適αj値に対して最大であるαとして選択する。
いくつかの実施形態において、ビデオエンコーダ(120)による損失の多い圧縮に起因する量子化の影響に対して調節するために、総合的に最適なアルファをさらに調節してもよい(例えば、α=α+Δα、但し、α>1の場合はΔは負の値であり、α<1の場合はΔは正の値である)。同パラメータ最適化処理は、複数の関数パラメータで特徴付けられる、他の線形または非線形量子化関数および再構築関数に、容易に拡張することができる。
表1は、図3に示す処理(所望のα<1である)に基づくある実施形態による、ガンマ符号化値を再構成するためのアルゴリズムの一例を疑似コードで示したものである。
表1:ガンマ符号化EDR信号について最適なαを算出する方法
Figure 2016529741
デコーダにおいて、逆構成処理(140)は以下のように表すことができる。
Figure 2016529741
いくつかの実施形態において、等式(4)のべき関数は、区分的線形多項式、区分的2次または3次多項式または区分的Bスプラインとして表すことができる。そのような実施の場合、量子化に関連するアーチファクトを避けるために、全区分にわたって、滑らかさおよび単調性に関する制約を与えるべきである。そして、これまでに、または、‘388出願において記載されたものと同様の検索方法を適用してもよい。
ブロック適応的な再構成関数
再び、それぞれNブロックに区分された(例えば、各ブロックは8x8ピクセル)F枚のビデオフレームを含むビデオシーンについて考える。画像ブロックはオーバーラップしていてもよいが、好適な実施形態においてはオーバーラップしていない。図4は、ある実施形態による、入力EDR符号語(102)を再構成済み出力値(112)にマッピングするためのデータフローの一例を示す。
先述のように、ブロックベースの複雑性尺度(MEDR)を定義できる。ある実施形態において、工程(405)において、限定はしないが、複雑性尺度がブロック内のピクセルの標準偏差(std)に基づいて算出されるものとして考える。なお、フレームj(j=1、2、...、F)におけるブロックnの標準偏差がゼロである(例えば、MEDR(j,n)=stdjn=0)かどうかを確認することは、このブロック内の最大値(例えば、B(j,n))とこのブロック内の最小値(例えば、A(j,n))との差異が0であるかどうかを確認することに等しい。
再構成関数(110)が区分的線形直線で構築されているとすると、入力viに対して、ローカル量子化器は以下のように表すことができる。
Figure 2016529741
Figure 2016529741
ただし、k(j,n)は、j番目のフレームのn番目のブロックにおける量子化器の傾きを調節するためのスケーリング係数である。
工程(410)において、Φが、ブロック尺度がある基準を満たす全ブロックの集合を表すものとする。例えば、Φが、量子化前に非ゼロの標準偏差を有する全ブロックの集合を表すものとする。すなわち、
Figure 2016529741
ある実施形態において、閾値Tth(ただし、限定はしないが、Tth≧1)が与えられ、ブロックの最小および最大ピクセル値が与えられると、工程(415)において、最適なk(j,n)は以下のように求められ得る。
Figure 2016529741
データ{A(j,n)、B(j,n)、k(j,n)}が与えられるとき、この3つの値は、区分[A(j,n)、B(j,n)]内で、量子化器は、少なくともk(j,n)の傾きを有するべきであることを示す。特定のEDR符号(例えば、vc)が複数[A(j,n)、B(j,n)]区分に属し得るとするならば、EDR符号語vcについて、各符号語について全ブロックを満足する最大の傾きを求める必要がある。
θ(vc)は、符号語vcをカバーする全ブロックにわたる全区分の集合を表すものとする。すなわち、
Figure 2016529741
すると、工程(420)において、符号語vcにおいて必要な傾きは、θ(vc)集合に属するブロック内の全ての最適な傾きの包絡線として求められ得る。すなわち、
Figure 2016529741
工程(425)において、これらの包絡線の傾き全ての合計を以下のように表記するものとすると、
Figure 2016529741
各vc符号語について、限定はしないが、工程(430)において、累積傾斜関数は以下のように定義されてもよい。
Figure 2016529741
全符号語が範囲[cL,cH]内にマッピングされることを担保するためには、vc符号語からsi値へのマッピングは、以下を用いて算出してもよい。
Figure 2016529741
等式(13)が与えられたとき、入力vc値と出力si値の間のマッピングは、順方向マッピングルックアップテーブル(例えば、LUTF(vc))を用いて算出してもよい。ある実施形態においては、このテーブルは、データと一緒に保存してもよいし、画像メタデータ(119)の一部としてデコーダに送信し、デコーダが逆方向マッピング処理を再構築し得るようにしてもよい。
Figure 2016529741
ある実施形態例において、表2は、疑似コードを用いて、図4に示すマッピング処理をまとめたものである。

表2
Figure 2016529741
いくつかの実施形態において、等式(12)では、代替的な関数を用いて累積傾斜関数k(vc)を算出してもよい。例えば、k(vc)値は、合算する前に、以下のようにフィルタリングまたは重み付けされてもよい。
Figure 2016529741
ただし、wiは、所定の重み、または、(2u+1)フィルタタップ(例えば、u=2であって、フィルタ係数はローパスフィルタのそれと対応する)を有するフィルタのフィルタ係数を表す。
図5は、[cL,cH]範囲を[0、255]とした場合の、フレーム群のテストシーケンスについての、vc符号語に対する包絡線傾きk(vc)値のプロットの一例を示す。
図5に示すデータに対して、図6は、vcに対する ̄付K(vc)マッピングの一例を示す。
逆再構成
デコーダにおいて、等式(13)の ̄付K(vc)値が与えられると、逆量子化器または再構成関数(140)は以下のようにして求められ得る。
各復号化符号語(^付sc)に対して、
Figure 2016529741
とすると、
Figure 2016529741
となる。
換言すれば、量子化領域(^付sc)における所与の符号語について、対応する推定EDR符号語(^付vc)は、まず、量子化値(^付sc)を有する全ピクセルをグループ分けし、対応するEDR符号語を見つけ、そして、集めた全EDR符号語の平均をとることによって構築される。等式(16)から、逆ルックアップテーブルLUTB(^付sc)を構築して、データと一緒に保存してもよいし、または例えばメタデータ(119)の一部としてこれをデコーダに送信してもよい。
Figure 2016529741
図6に示すデータに対して、図7は、
Figure 2016529741
マッピングまたは逆再構成(140)の一例を示す。
ある実施形態において、
Figure 2016529741
という関係によって定義されるマッピングは、メタデータ(119、127)を用いてデコーダに送信してもよい。このような手法は、ビットレートオーバーヘッドの観点から高コスト過ぎるかもしない。例えば、8ビットデータの場合、ルックアップテーブルは255個のエントリを含んでおり、これがシーンチェンジのたびに送信されてもよい。他の実施形態においては、逆方向マッピングを区分的多項式近似に置き換えてもよい。このような多項式は典型的には1次および2次多項式を含むが、高次多項式またはBスプラインを用いることも可能である。あるレイヤl(l=0、1、...、L−1)に対する1つのLUTを近似する多項式の数は、利用可能な帯域幅および処理の複雑度によって変わり得る。ある実施形態において、エンハンスメントレイヤが単一の区分を使用するのに対して、ベースレイヤは最大8区分を使用する。
表3は、ある実施形態において、2次多項式を用いてデコーダLUTテーブルを近似するアルゴリズムの一例を示す。
表3:2次多項式を用いたLUT近似
Figure 2016529741
Figure 2016529741
表3に示すように、ある実施形態において、近似処理の入力は、元のルックアップテーブル(例えば、等式(16)を用いて算出)と、LUT中の値および多項式近似により生成される値の間の許容可能な誤差範囲と、利用可能な符号語数と、その最初の符号語値(等式(1)参照)とを含む。出力は、各多項式のエンドポイント(ピボットポイントとも呼ぶ)と、多項式係数とを含み得る。
最初のピボットポイントからスタートして、アルゴリズムは、限定はしないが2次多項式を用いて、利用可能な符号語の最大範囲のフィッティングを試みる。平均二乗誤差多項式フィット等のような、任意の既知の多項式フィットアルゴリズムを用いてよい。
算出最大誤差が入力許容範囲を超える場合、最適な多項式のパラメータを保存して、新たな多項式の検索を開始し、これをLUTテーブル全体がマッピングされるまで行う。
いくつかの実施形態において、1つのLUTを近似するのに使用できる多項式数が固定値(例えば8)に制限される場合がある。その場合、より大きな誤差許容範囲をアルゴリズムに組み込んでよい。
表3の方法はまた、より高次の多項式、Bスプラインまたは近似関数の組み合わせなどの他の近似関数に対応するようにも容易に改変可能である。
知覚的に均質な色空間における符号化
ビデオ信号は典型的にはよく知られたRGB色空間に描画されるが、MPEG−2、H.264(AVC)、H.265(HEVC)等のようなほとんどのビデオ圧縮規格は、これと対立するYCbCrまたはYUVのような色空間で使用するように最適化されている。これらの色空間は、8〜10ビットの標準ダイナミックレンジ(SDR)ビデオを符号化および送信するのには十分であるが、ビット/ピクセル要件の観点からは、EDRビデオを符号化および送信する際に最も効率が良いとはいえない。例えば、Lu’v’およびLog(L)u’v’色空間がこれまでに提唱されている。
発明者らの理解によれば、知覚的に均質な色空間における信号の符号化は、ビデオコーデックによる処理の前のu’およびv’色度データを追加的に処理することによって利点を有し得る。例えば、ある実施形態において、エンコーダにおいて、このような処理は、信号再構築処理(110)の一部として入力信号(102)上で行われ得る。
白色点変換
ある実施形態において、線形XYZからルマu’v’色空間への変換は、以下の工程を含み得る。
a)白色点の座標(例えば、D65)を定義し、
b)Luma=f(Y)について解を求め、
c)X、YおよびZからu’およびv’について解を求める。
本明細書において、関数f(Y)は、L(またはL’)、Log(L)等のような明度に関連する関数を表している。好適な実施形態において、f(Y)は、‘212出願に記載したような知覚的量子化(PQ)マッピング関数を表していてもよい。
ある実施形態においては、白色点は、u’およびv’座標を用いてD65(6500K)と定義されてもよい。
Du=d65u=0.1978300066428;
Dv=d65v=0.4683199949388;
ある実施形態において、u’およびv’は以下のように求めることができる。
Figure 2016529741
逆演算処理は以下を含む。
a)白色点の座標(例えば、D65)を定義し、
b)Y=f-1(Luma)について解を求め、
c)u’およびv’からXおよびZについて解を求める。
例えば、‘212出願による知覚的量子化関数を用いる実施形態においては、対応する逆PQマッピングを適用してYピクセル値を生成することが可能である。
ある実施形態において、XおよびZは以下のように求めることができる。
Figure 2016529741
図8Aは、u’v’色度空間における白色点(805)(例えば、D65)の従来のマッピングを示している。図8Aに示すように、u’およびv’色度値の範囲は、概ね、u’については(0、0.623)であり、v’については(0、0.587)である。図8Aに示すように、D65白色点は、u’v’信号表記では中心ではない。これにより、色差成分をサブサンプリングおよびアップサンプリングして、元の4:4:4色フォーマットとビデオ符号化において典型的に用いられる4:2:0または4:2:2色フォーマットとの間の変換を行った後に、色ズレが生じ得る。このような色ズレを軽減するために、色度値に変換関数を適用することが推奨される。ある実施形態において、この変換関数によって、白色点を、概ね、変換後のu’v’の中心にずらすが、白色点は、クロマ誤差を引きつけたい任意の他の色値に置き換えられてもよい。例えば、変換後の値u’tおよびv’tが(0、1)の範囲内にある場合、以下のマッピングを適用してもよい。
Figure 2016529741
ただし、DuおよびDvは選択された白色点の元のu’およびv’座標を表し、(b1、b2)は変換後の色空間における白色点の所望位置の座標を決定し、ai(i=1、2)は、所望の変換点およびu’およびv’の最小および最大値に基づいて算出される定数である。ある実施形態において、変換パラメータ(例えば、a1およびa2)は、全体のビデオシーケンスについて固定であってもよい。別の実施形態においては、入力コンテンツの色度範囲が変化することを利用するために、シーン毎またはフレーム毎に変換パラメータを算出してもよい。
図8Bは、ある実施形態例による変換後の色度空間における白色点(805)のマッピングを示す。図8Bにおいて、元のu’およびv’色度値は、選択点(例えば、D65)が概ね変換後の色度空間の中心(0.5、0.5)になるように置き換えられる。例えば、変換後の値u’tおよびv’tが(0、1)内であれば、b1=b2=0.5について、ある実施形態において、以下のマッピングを適用してもよい。
Figure 2016529741
ただし、DuおよびDvは、選択された白色点のu’およびv’座標を表す。この変換の結果、色誤差は、色相ずれではなく、脱飽和に見えるであろう。u’およびv’色度値に非線形関数を適用して、これと同じ変換を実現することも可能であることは当業者であれば理解できるであろう。このような非線形関数は、符号化および量子化による色誤差の可視性をさらに低減するために、ほぼ中間色である色に対してより高い精度を割り当ててもよい。
クロマエントロピーの低減
u’およびv’ピクセル成分に光度の関数を掛ければ、クロマ的詳細の可視性をより改善できるかもしれない。例えば、ある実施形態において、変換された色度値は以下のように求めてもよい。
Figure 2016529741
ただし、g(Luma)はルマチャネルの関数を表している。ある実施形態において、g(Luma)=Lumaである。
デコーダにおいて、入力信号はLumau’tv’tと表記され得る。多くの用途において、この信号は、さらなる処理の前に、変換してXYZ、RGBまたは他の色空間に戻さなければならない。ある実施形態例において、Lumau’tv’tからXYZへの色変換処理は、以下の工程を含み得る。
a)Luma符号化を元に戻し、
Y=f-1(Luma)
b)u’tおよびv’tの値をスケーリングする範囲を元に戻して、u’およびv’に戻し、
c)等式(18)を用いてXおよびZを復元する。
いくつかの実施形態において、入力信号のLuma、u’tおよびv’t成分は、何らかの色変換を行う前に、(0、1)範囲に正規化してもよい。いくつかの実施形態において、ルックアップテーブル、乗算、加算を組み合わせることによって等式(17)〜(21)を実行してもよい。例えば、ある実施形態において、
Y=f-1(Luma)
B=3u’、
C=20v’、および
D=1/(4v’)
が、Luma、u’およびv’を入力とする3つのルックアップテーブルの出力を表しているとすると、等式(18)から、XおよびZの値は、以下のように4つの乗算と2つの加算を用いて算出され得る。
Z=(Y*D)*(12−B−C)
および
X=(Y*D)*(3*B)
例えば、ある実施形態において、10ビット符号化信号について、各LUTは、それぞれターゲットアプリケーションにとって十分な精度(例えば、32ビット)を持つ1024個のエントリを含んでいてもよい。
図9は、本発明のある実施形態による、符号化および復号化パイプラインの一例を示す。入力信号(902)は、RGB4:4:4または他の適切な色フォーマットであり得る。工程(910)において、例えば、輝度値に対し知覚的量子化(PQ)マッピング、および色度値に対し等式(17)を用いて、信号(902)を知覚的ルマ u’v’フォーマットに置き換えられる。工程(915)において、白色点が概ね変換された色度空間の中心に位置するように、例えば、等式(19)〜(21)に示す変換を適用して、元のu’v’色度値を変換された色度値u’tおよびv’tに置き換える。この色変換および変換後Lumau’tv’t4:4:4信号(例えば、917)は、ビデオエンコーダ(920)による符号化の前に、4:2:0または4:2:2フォーマットに色サブサンプリングされてもよい(図示せず)。ビデオエンコーダ(920)は、上述のように、信号再構成(110)およびレイヤ分解(115)処理を含んでいてもよい。受信器上では、ビデオデコーダ(930)が復号化信号(932)を生成する。ビデオデコーダ(930)は、信号逆再構成およびレイヤ結合器(140)を備えていてもよい。任意の色アップサンプリング(例えば、4:2:0から4:4:4)の後に、(915)の変換演算処理を逆転することによって、逆色度変換工程(935)がLumau’tv’t信号(932)を変換してLuma u’v’信号(937)に戻してもよい。最後に、Luma u’v’信号(937)を変換して、RGBまたは他の適切な色空間の出力信号(942)とし、これを表示またはさらに処理してもよい。
知覚的量子化されたIPT色空間における符号化
白色点変換は、IPT色空間またはIPT−PQ色空間(エンハンストまたはハイダイナミックレンジを有するビデオ信号の符号化に理想的に適していると思われる知覚的量子化された色空間)のような他の色空間にも適用してもよい。IPT−PQ色空間を最初に記載したのは、本願にその全文が援用される、R.Atkinsらによる2014年2月13日出願の「Display management for high dynamic range video」という表題のPCT出願PCT/US2014/016304である。
本願にその全文が援用される、F.EbnerおよびM.D.Fairchildによる「Development and testing of a color space (ipt) with improved hue uniformity」、Proc.6th Color Imaging Conference: Color Science, Systems, and Applications, IS&T, Scottsdale, Arizona、1998年11月、pp.8−13(「Ebner論文」と呼ぶ)に記載のIPT色空間は、人間の視覚システムにおける錐体間の色差のモデルである。その意味ではYCbCrまたはCIE−Lab色空間のようであるが、いくつかの科学的研究において、これらの空間よりも人間の視覚処理をより良く模擬することが分かっている。CIE−Labと同様に、IPTは、何らかの参照輝度に対する正規化された空間である。ある実施形態において、正規化は、ターゲットディスプレイの最大輝度に基づいていてもよい。
本明細書において、用語「PQ」は知覚的量子化を指す。人間の視覚システムは、光レベルの増大に対して非常に非線形的に反応する。人間が刺激を見る能力は、その刺激の輝度、その刺激の大きさ、その刺激を構成する空間周波数、および、その刺激を見ている瞬間までに目が適応した輝度レベルに影響される。好適な実施形態において、知覚的量子化器関数は、線形入力グレイレベルを、人間の視覚システムにおけるコントラスト感度閾値によりマッチした出力グレイレベルにマッピングする。PQマッピング関数の一例は、‘212出願に記載されており、この出願の全文を本願に援用する。ある固定刺激サイズに対して、それぞれの輝度レベル(即ち、刺激レベル)について、最高感度の適応レベルおよび最高感度の空間周波数(HVSモデルによる)に応じて、その輝度レベルにおける最小可視コントラストステップを選択する。物理的な陰極線管(CRT)装置の応答曲線を表しており、人間の視覚システムの応答の仕方に対して非常に大まかな意味での類似性を偶然有し得る従来のガンマ曲線と比較して、‘212出願において決定されているPQ曲線は、比較的シンプルな関数モデルを用いながら人間の視覚システムの本当の視覚応答を模擬している。
表1は、表示時点においてデジタルビデオ符号値を絶対線形輝度レベルに変換するための知覚的曲線EOTFの計算を示している。絶対線形輝度をデジタル符号値に変換するための逆OETFの計算も含まれている。

表1
例示的な等式定義:
D=知覚的曲線デジタル符号値、SDI−legal符号無し整数、10または12ビット
b=デジタル信号表記における成分毎のビット数、10または12
V=正規化された知覚的曲線信号値、0≦V≦1
Y=正規化された輝度値、0≦Y≦1
L=絶対輝度値、0≦L≦10,000cd/m2

例示的なEOTF復号化等式:
Figure 2016529741

例示的なOETF符号化等式:
Figure 2016529741

例示的な定数:
Figure 2016529741

備考:
1.演算子INTは、0〜0.4999...の範囲の小数部に対しては値0を返し、0.5〜0.9999...の範囲の小数部に対しては+1を返す(即ち、0.5より大きい小数部は切り上げ)。
2.定数は全て四捨五入の問題を回避するために、12ビット有理数のちょうどの倍数として定義する。
3.R、GまたはB信号成分は、上記のY信号成分と同じ方法で算出する。
IPT−PQ色空間への信号の変換は、以下の工程を含み得る。
a)入力色空間(例えば、RGBまたはYCbCr)からXYZに信号を変換する。
b)以下のように、信号をXYZからIPT−PQに変換する。
a.3x3XYZをLMS行列に適用して、信号をXYZからLMSに変換する。
b.LMS信号の各色成分を知覚的量子化されたLMS信号(L’M’S’またはLMS−PQ)に変換する(例えば、等式(t2)を適用して)。
c.3x3LMSをIPT行列に適用して、LMS−PQ信号をIPT−PQ色空間に変換する。
3x3XYZからLMS、および、L’M’S’(またはLMS−PQ)からIPTの変換行列の例は、Ebner論文に見出すことができる。IPT−PQ信号の色成分(例えば、P’およびT’)が範囲(−0.5、0.5)内にあるとすると、色成分の範囲が実質的に範囲(0、1)内となるように、バイアスa(例えば、a=0.5)を加えてもよい。例えば、
Figure 2016529741
逆色演算処理は、以下の工程を含み得る。
a)色成分に加えられた全てのバイアス値を引いておき、
b)3x3I’P’T’をLMS変換行列に適用して、IPT−PQからLMS−PQに変換し、
c)逆PQ関数を適用して、LMS−PQからLMSに変換し(例えば、等式(t1)を使用)、
d)3x3LMSをXYZ変換に適用して、LMSからXYZに変換し、
e)XYZから、選択した装置依存の色空間(例えば、RGBまたはYCbCr)に変換する。
実際には、符号化および/または復号化の際の色変換工程は、予め算出した1−Dルックアップテーブル(LUTs)を用いて行われてもよい。
クロマエントロピーの低減
上述のように、P’およびT’ピクセル成分に光度の関数(例えば、I’)を掛ければ、クロマ的詳細の可視性はさらに改善されるかもしれない。例えば、ある実施形態において、変換された色度値は以下のように求めることができる。
Figure 2016529741
ただし、g(I’)は、ルマチャネル(I’)の線形または非線形関数を表している。ある実施形態において、g(I’)=I’である。
コンピュータシステム実装例
本発明の実施形態は、コンピュータシステム、電子回路およびコンポーネントで構成されたシステム、マイクロコントローラ、フィールドプログラマブルゲートアレイ(FPGA)または他のコンフィギュラブルまたはプログラマブルロジックデバイス(PLD)、離散時間またはデジタル信号プロセッサ(DSP)、特定用途向けIC(ASIC)などの集積回路(IC)デバイス、および/または、このようなシステム、デバイスまたはコンポーネントを1つ以上含む装置、を用いて実施し得る。このコンピュータおよび/またはICは、本明細書に記載のようなエンハンストダイナミックレンジ(EDR)を有するビデオ画像の階層符号化のための適応的再構成技術に関する命令を行い、制御し、または実行し得る。このコンピュータおよび/またはICは、本明細書に記載の適応的再構成プロセスに関する様々なパラメータまたは値のいずれを演算してもよい。画像およびビデオ実施形態は、ハードウェア、ソフトウェア、ファームウェア、および、その様々な組み合わせで実施され得る。
本発明の特定の態様は、本発明の方法をプロセッサに行わせるためのソフトウェア命令を実行するコンピュータプロセッサを含む。例えば、ディスプレイ、エンコーダ、セットトップボックス、トランスコーダなどの中の1つ以上のプロセッサは、そのプロセッサがアクセス可能なプログラムメモリ内にあるソフトウェア命令を実行することによって、上記のようなエンハンストダイナミックレンジ(EDR)を有するビデオ画像の階層符号化のための適応的再構成技術に関する方法を実装し得る。本発明は、プログラム製品形態で提供されてもよい。このプログラム製品は、データプロセッサによって実行された時に本発明の方法をデータプロセッサに実行させるための命令を含む1セットの、コンピュータが可読な信号を格納する任意の媒体を含み得る。本発明によるプログラム製品は、様々な形態をとり得る。例えば、このプログラム製品は、フロッピーディスク、ハードディスクドライブを含む磁気データ記憶媒体、CD ROM、DVDを含む光学データ記憶媒体、ROM、フラッシュRAMなどを含む電子データ記憶媒体、などの物理的媒体を含み得る。このプログラム製品上のコンピュータ可読信号は、任意に、圧縮または暗号化されていてもよい。
上記においてあるコンポーネント(例えば、ソフトウェアモジュール、プロセッサ、アセンブリ、デバイス、回路など)に言及している場合、そのコンポーネントへの言及(「手段」への言及を含む)は、そうでないと明記されている場合を除いて、当該コンポーネントの機能を果たす(例えば、機能的に均等である)あらゆるコンポーネント(上記した本発明の実施形態例に出てくる機能を果たす開示構造に対して構造的に均等ではないコンポーネントも含む)を、当該コンポーネントの均等物として、含むものと解釈されるべきである。
均等物、拡張物、代替物、その他
エンハンストダイナミックレンジ(EDR)を有するビデオ画像の階層符号化のための適応的再構成技術に関する実施形態例を上述した。この明細書中において、実装毎に異なり得る多数の詳細事項に言及しながら本発明の実施形態を説明した。従って、本発明が何たるか、また、本出願人が本発明であると意図するものを示す唯一且つ排他的な指標は、本願が特許になった際の請求の範囲(今後出されるあらゆる訂正を含む、特許となった特定請求項)である。当該請求項に含まれる用語に対して本明細書中に明示したあらゆる定義が、請求項内で使用される当該用語の意味を決定するものとする。よって、請求項において明示されていない限定事項、要素、性質、特徴、利点または属性は、その請求項の範囲をいかなる意味においても限定すべきではない。従って、本明細書および図面は、限定的ではなく、例示的であるとみなされるものである。

Claims (28)

  1. エンハンストダイナミックレンジ(EDR)の入力符号語を量子化出力符号語にマッピングする方法であって、
    画像ブロックを含む入力エンハンストダイナミックレンジ(EDR)画像のシーケンスを受信する工程と、
    前記入力EDR画像の前記シーケンス内の少なくとも1つの入力画像において前記画像ブロックのうち1つ以上についてブロック複雑性尺度を算出する工程と、
    前記画像ブロックの第1の集合を構築する工程であって、前記第1の集合は算出したブロック複雑性尺度が所定の基準を満たす画像ブロックを含む、工程と、
    前記画像ブロックの前記第1の集合中の各ブロックに対して、線形量子化モデルの傾き生成関数によって最適な傾き(k(j,n))を決定する工程と、
    前記入力EDR画像の前記シーケンスの各入力符号語(vc)に対し、
    画像ブロックの第2の集合を構築する工程であって、前記第2の集合は前記画像ブロックの前記第1の集合に属するブロックを含んでおり、かつ前記入力符号語は前記画像ブロックの最小および最大ピクセル値内にある、工程、
    前記画像ブロックの第2の集合中のブロックの前記最適な傾きの関数として、前記入力符号語について包絡線の傾き(k(vc))を生成する工程、および
    全符号語についての前記包絡線の傾きの総和(k)を算出する工程と、
    各入力符号語に対し、
    累積傾斜(K(vc))を生成する工程であって、前記累積傾斜は、前記入力符号語の1つ以上の前記包絡線の傾きの関数を含む、工程、および
    前記入力符号語と出力符号語との間のマッピング関数を生成する工程であって、前記マッピング関数は、少なくとも前記符号語の前記累積傾斜と全符号語の全包絡線の傾きの総和とに基づいて算出される工程と、を包含する方法。
  2. さらに、
    前記マッピング関数を前記入力EDR画像に適用して、これにより、再構成した画像を生成する工程と、
    前記再構成した画像を1つ以上のレイヤに分解する工程と、
    1つ以上のビデオエンコーダを用いて前記1つ以上のレイヤを符号化する工程と、を包含する請求項1に記載の方法。
  3. 再構成されたピクセルsとL個のレイヤとが与えられ、前記分解工程は前記sピクセルをslピクセル値にマッピングすることを含み、
    l=Clip3(s,pl,pl+1−1)−pl
    l=0、1、...、L−1は、前記L個のレイヤのうちの1つを表し、Clip3()は、plおよびpl+1−1の値の間において再構成したピクセルsをクリッピングするクリッピング関数であり、plは、レベルlにおいて前記再構成したシーケンスの最小ピクセル値を表す、請求項2に記載の方法。
  4. 0=0、かつ、
    Figure 2016529741
    であり、
    jは、レベルjにおいてビデオエンコーダのために利用可能な符号語の数を表している、請求項3に記載の方法。
  5. 前記線形量子化モデルは、
    Figure 2016529741
    によって表される関数を含み、
    ただし、vLおよびvHは前記EDR入力シーケンス内の最小および最大符号語値を表し、cLおよびcHは最小および最大出力符号値を表し、k(j,n)は前記EDR入力シーケンス内のj番目のフレームのn番目のブロックにおける量子化傾きを表し、viは入力符号語を表し、siは対応する出力符号語を表す、請求項1に記載の方法。
  6. 前記最適な傾きk(j,n)は、
    Figure 2016529741
    を算出することによって生成され、ここで、Tthは所定の閾値であり、B(j,n)はフレームjのブロックn内の最大ピクセル値を表し、A(j,n)はフレームjのブロックn内の最小ピクセル値を表す、請求項5に記載の方法。
  7. ある画像ブロックの前記ブロック複雑性尺度を算出する工程は、前記画像ブロック内の前記最大および最小ピクセル値の差異を算出することを含み、前記画像ブロックの第1の集合はそのブロック複雑性尺度が0よりも大きい全画像ブロックを含む、請求項1に記載の方法。
  8. 前記vc符号語に対する包絡線の傾きk(vc)を生成する工程は、
    Figure 2016529741
    を算出することを含み、ここで、k(j,n)は前記入力EDR画像シーケンスのフレームjのブロックnに対する最適な傾きを表し、θ(vc)は前記第2の画像ブロックの集合を表す、請求項1に記載の方法。
  9. 前記符号語vcに対する累積傾斜K(vc)を算出する工程は、
    Figure 2016529741
    を算出することを含み、ここで、k(i)はi番目の入力EDR符号語に対する前記包絡線の傾きを表す、請求項1に記載の方法。
  10. 前記入力符号語と前記出力符号語との間の前記マッピング関数 ̄付K(vc)を生成する工程は、
    Figure 2016529741
    を算出することを含み、ここで、K(vc)は符号語vcに対する累積傾斜を表し、kは全符号語の全包絡線の傾きの総和を表し、cLおよびcHは最小および最大出力符号値を表す、請求項1に記載の方法。
  11. EDR符号化システムにおいて、受信したマッピング済み符号語と出力EDR符号語との間の逆方向マッピングを生成する方法であって、受信したマッピング済み符号語は請求項1に記載の方法によって生成され、
    ある受信したマッピング済み符号語について、順方向マッピング関数を用いて、前記受信したマッピング済み符号語にマッピングされ得る全EDR符号語を特定する工程と、
    前記受信したマッピング済み符号語にマッピングされた、全ての特定されたEDR符号語の平均に基づいて算出された出力EDR符号語に前記受信したマッピング済み符号語をマッピングすることによって、逆方向マッピングを生成する工程と、を包含する方法。
  12. エンハンストダイナミックレンジ(EDR)の入力符号語を量子化出力符号語にマッピングする方法であって、
    画像ブロックを含む入力エンハンストダイナミックレンジ(EDR)画像のシーケンスを受信する工程と、
    前記入力EDR画像の前記シーケンス内の少なくとも1つの入力画像において前記画像ブロックのうち1つ以上について第1のブロック複雑性尺度を算出する工程と、
    前記画像ブロックの第1の集合を構築する工程であって、前記第1の集合は算出したブロック複雑性尺度が第1の所定の基準を満たす画像ブロックを含む、工程と、
    入力符号語を量子化出力符号語にマッピングするためのあるマッピング関数について関数パラメータ値の候補セットを選択する工程と、
    前記画像ブロックの前記第1の集合に属するブロックにおける入力EDR符号語に、前記関数パラメータの前記候補セットを有する前記マッピング関数を適用することによって、マッピングされた符号値を生成する工程と、
    前記生成されたマッピング済み符号値に基づいて、前記選択された候補セットが最適であるかどうかを決定する工程とを包含し、
    前記選択された候補セットが最適であるかどうかを決定する工程は、
    前記第1の集合に属するブロックの1つ以上について、その生成されたマッピング済み符号値を用いて、第2のブロック複雑性尺度を算出する工程と、
    画像ブロックの第2の集合を構築する工程であって、前記第2の集合は前記第2のブロック尺度が第2の所定の基準を満たす画像ブロックを含んでいる工程と、
    前記第2の集合のブロック数が前記第1の集合のブロック数と同じである場合、前記選択された候補セットが最適であるかどうかを決定する工程と、を含む、方法。
  13. 複数ピクセルを含むある画像ブロックについて前記第1のブロック複雑性尺度を算出する工程は、前記ブロック内のピクセル値の標準偏差を算出することを含み、前記第1の所定の基準は前記第1のブロック複雑性尺度がゼロよりも大きいかどうかを比較する工程を含む、請求項12に記載の方法。
  14. 前記関数パラメータの候補セットは、
    Figure 2016529741
    として算出される量子化関数の指数αを含み、ここで、vLおよびvHは前記EDR入力シーケンスにおける最小および最大符号語値を表し、cLおよびcHは最小および最大出力符号値を表し、viは入力符号語を表し、siは対応する出力符号語を表す、請求項12に記載の方法。
  15. 第1のビデオエンコーダは第1のビット深度を用いて第1のレイヤを符号化し、第2のビデオエンコーダは第2のビット深度を用いて第2のレイヤを符号化し、前記第2のビット深度は前記第1のビット深度とは異なる、請求項2に記載の方法。
  16. 前記第1のビット深度は8ビットであり、第2のビット深度は10ビット、12ビットまたは14ビットである、請求項15に記載の方法。
  17. 第1のビデオエンコーダは第1の符号化フォーマットを用いて第1のレイヤを符号化し、第2のビデオエンコーダは第2の符号化フォーマットを用いて第2のレイヤを符号化し、前記第2の符号化フォーマットは前記第1の符号化フォーマットとは異なる、請求項2に記載の方法。
  18. 前記第1の符号化フォーマットはMPEG−2符号化フォーマットであり、前記第2の符号化フォーマットはAVCまたはHEVC符号化フォーマットである、請求項17に記載の方法。
  19. ビデオ符号化の際に色に関連するアーチファクトを低減する方法であって、
    輝度成分および2つの色度成分を含むある色空間における入力信号にアクセスする工程と、
    前記入力信号の前記色空間における白色点の元の白色点色度座標(Du、Dv)を決定する工程と、
    色度変換関数を用いて前記入力信号を、2つの変換された色度成分を含む変換後の色空間における第2の信号に変換する工程であって、前記色度変換関数は、前記元の白色点色度座標を、前記変換後の色度色空間における所定の第2の一組の座標にシフトさせる、工程と、
    前記第2の信号を符号化して符号化ビットストリームを生成する工程と、を包含する方法。
  20. 前記入力色空間は、知覚的量子化された輝度成分(Luma)ならびにu’およびv’色度成分を含む、請求項19に記載の方法。
  21. 前記色度変換関数は、
    Figure 2016529741
    を算出することを含み、ここで、ある色度成分に対して、Cは入力色度値を表し、Ctは変換された色度値を表し、Dcは元の白色点座標値を表し、aは定数であり、bは前記白色点座標の所定の別の一組の座標値である、請求項19に記載の方法。
  22. bは概ね0.5に等しく、aは1.0から1.5の間で定義される、請求項21に記載の方法。
  23. 前記色度変換関数は、
    Figure 2016529741
    を算出することを含み、ここで、ある色度成分について、Cは入力色度値を表し、Ctは変換された色度値を表し、Dcは元の白色点座標値を表し、g(Luma)は前記入力信号の輝度成分の関数を表し、aは定数であり、bは前記白色点座標の所定の別の一組の座標値である、請求項19に記載の方法。
  24. 前記符号化工程の前に前記第2の信号の色度成分をサブサンプリングする工程をさらに包含する、請求項19に記載の方法。
  25. 前記白色点の、所定の別の一組の座標は、概ね、前記変換後の色度色空間の中心にある、請求項19に記載の方法。
  26. 前記色度変換関数は、
    Figure 2016529741
    を算出することを含み、ここで、ある色度成分について、Cは入力色度値を表し、Ctは変換された色度値を表し、g(I)は前記入力信号の輝度成分の関数を表し、aは定数を表し、ここで、Cは知覚的量子化されたIPT色空間(IPT−PQ)内の信号の色成分を含み、Iは前記知覚的量子化されたIPT色空間内の信号の輝度成分を含む、請求項19に記載の方法。
  27. プロセッサを備え、請求項1から26に記載の方法のいずれかを実行するように構成された装置。
  28. 請求項1から26のいずれかに記載の方法を実行するためのコンピュータが実行可能な命令を格納した非一時的コンピュータ可読記憶媒体。
JP2015563023A 2013-06-17 2014-06-16 エンハンストダイナミックレンジ信号の階層符号化のための適応的再構成 Active JP6038360B2 (ja)

Applications Claiming Priority (7)

Application Number Priority Date Filing Date Title
US201361836044P 2013-06-17 2013-06-17
US61/836,044 2013-06-17
US201461951914P 2014-03-12 2014-03-12
US61/951,914 2014-03-12
US201462002631P 2014-05-23 2014-05-23
US62/002,631 2014-05-23
PCT/US2014/042583 WO2014204865A1 (en) 2013-06-17 2014-06-16 Adaptive reshaping for layered coding of enhanced dynamic range signals

Related Child Applications (2)

Application Number Title Priority Date Filing Date
JP2016169138A Division JP6181259B2 (ja) 2013-06-17 2016-08-31 エンハンストダイナミックレンジ信号の階層符号化のための適応的再構成
JP2016213145A Division JP6312775B2 (ja) 2013-06-17 2016-10-31 エンハンストダイナミックレンジ信号の階層符号化のための適応的再構成

Publications (2)

Publication Number Publication Date
JP2016529741A true JP2016529741A (ja) 2016-09-23
JP6038360B2 JP6038360B2 (ja) 2016-12-07

Family

ID=51134441

Family Applications (3)

Application Number Title Priority Date Filing Date
JP2015563023A Active JP6038360B2 (ja) 2013-06-17 2014-06-16 エンハンストダイナミックレンジ信号の階層符号化のための適応的再構成
JP2016169138A Active JP6181259B2 (ja) 2013-06-17 2016-08-31 エンハンストダイナミックレンジ信号の階層符号化のための適応的再構成
JP2016213145A Active JP6312775B2 (ja) 2013-06-17 2016-10-31 エンハンストダイナミックレンジ信号の階層符号化のための適応的再構成

Family Applications After (2)

Application Number Title Priority Date Filing Date
JP2016169138A Active JP6181259B2 (ja) 2013-06-17 2016-08-31 エンハンストダイナミックレンジ信号の階層符号化のための適応的再構成
JP2016213145A Active JP6312775B2 (ja) 2013-06-17 2016-10-31 エンハンストダイナミックレンジ信号の階層符号化のための適応的再構成

Country Status (6)

Country Link
US (2) US9584811B2 (ja)
EP (1) EP3011741B1 (ja)
JP (3) JP6038360B2 (ja)
CN (2) CN106488246B (ja)
HK (1) HK1217393A1 (ja)
WO (1) WO2014204865A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2023502443A (ja) * 2019-11-27 2023-01-24 ドルビー ラボラトリーズ ライセンシング コーポレイション Hdr画像化におけるレート制御認識リシェーピング

Families Citing this family (67)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3111645A1 (en) 2014-02-26 2017-01-04 Dolby Laboratories Licensing Corporation Luminance based coding tools for video compression
MX357792B (es) * 2014-06-10 2018-07-25 Panasonic Ip Man Co Ltd Sistema de visualizacion, metodo de visualizacion y aparato de visualizacion.
CN110675840B (zh) * 2014-06-26 2022-03-25 松下知识产权经营株式会社 显示装置及显示方法
WO2016047085A1 (ja) * 2014-09-22 2016-03-31 パナソニックIpマネジメント株式会社 再生方法および再生装置
US9936199B2 (en) 2014-09-26 2018-04-03 Dolby Laboratories Licensing Corporation Encoding and decoding perceptually-quantized video content
EP3035688B1 (en) 2014-12-18 2019-07-31 Dolby Laboratories Licensing Corporation Encoding and decoding of 3d hdr images using a tapestry representation
JP7106273B2 (ja) 2015-01-27 2022-07-26 インターデジタル マディソン パテント ホールディングス, エスアーエス 画像及びビデオを電気光変換及び光電気変換するための方法、システム、及び機器
EP3051489A1 (en) * 2015-01-30 2016-08-03 Thomson Licensing A method and apparatus of encoding and decoding a color picture
CN107409210B (zh) * 2015-01-30 2021-01-12 交互数字Vc控股公司 匹配不同动态范围的彩色图片之间的色彩的方法和设备
AU2016212243B2 (en) 2015-01-30 2020-11-26 Interdigital Vc Holdings, Inc. A method and apparatus of encoding and decoding a color picture
KR102423434B1 (ko) * 2015-02-17 2022-07-22 소니그룹주식회사 송신 장치, 송신 방법, 수신 장치 및 수신 방법
US10419762B2 (en) 2015-03-02 2019-09-17 Dolby Laboratories Licensing Corporation Content-adaptive perceptual quantizer for high dynamic range images
CN112929670A (zh) * 2015-03-10 2021-06-08 苹果公司 自适应色度下采样和色彩空间转换技术
JP6374614B2 (ja) * 2015-03-20 2018-08-15 ドルビー ラボラトリーズ ライセンシング コーポレイション 信号再整形近似
WO2016154336A1 (en) * 2015-03-25 2016-09-29 Dolby Laboratories Licensing Corporation Chroma subsampling and gamut reshaping
US10015491B2 (en) 2015-04-06 2018-07-03 Dolby Laboratories Licensing Corporation In-loop block-based image reshaping in high dynamic range video coding
US20160309154A1 (en) * 2015-04-17 2016-10-20 Qualcomm Incorporated Dynamic range adjustment for high dynamic range and wide color gamut video coding
WO2016172091A1 (en) * 2015-04-22 2016-10-27 Dolby Laboratories Licensing Corporation Signal reshaping and coding in the ipt-pq color space
US10257526B2 (en) * 2015-05-01 2019-04-09 Disney Enterprises, Inc. Perceptual color transformations for wide color gamut video coding
EP3304912A4 (en) * 2015-06-07 2018-06-06 Sharp Kabushiki Kaisha Systems and methods for optimizing video coding based on a luminance transfer function or video color component values
US10397585B2 (en) * 2015-06-08 2019-08-27 Qualcomm Incorporated Processing high dynamic range and wide color gamut video data for video coding
CN107431822B (zh) * 2015-06-09 2019-11-29 华为技术有限公司 图像编解码方法和设备
EP3113495A1 (en) * 2015-06-30 2017-01-04 Thomson Licensing Methods and devices for encoding and decoding a hdr color picture
CN107771392B (zh) * 2015-06-30 2021-08-31 杜比实验室特许公司 用于高动态范围图像的实时内容自适应感知量化器
EP3113496A1 (en) 2015-06-30 2017-01-04 Thomson Licensing Method and device for encoding both a hdr picture and a sdr picture obtained from said hdr picture using color mapping functions
EP3323243B1 (en) 2015-07-16 2022-01-19 Dolby Laboratories Licensing Corporation Signal reshaping and decoding for hdr signals
WO2017015397A1 (en) 2015-07-22 2017-01-26 Dolby Laboratories Licensing Corporation Video coding and delivery with both spatial and dynamic range scalability
US10609395B2 (en) 2015-07-28 2020-03-31 Vid Scale, Inc. High dynamic range video coding architectures with multiple operating modes
JP6320440B2 (ja) * 2015-08-04 2018-05-09 ドルビー ラボラトリーズ ライセンシング コーポレイション ハイダイナミックレンジ信号のための信号再構成
CN107925780B (zh) * 2015-08-20 2021-03-19 Lg 电子株式会社 广播信号发送方法及广播信号接收方法
US10652588B2 (en) 2015-09-21 2020-05-12 Vid Scale, Inc. Inverse reshaping for high dynamic range video coding
JP6609708B2 (ja) * 2015-09-23 2019-11-20 アリス エンタープライジズ エルエルシー 高ダイナミックレンジ映像データの再形成および適応のためのシステムおよび方法
US10778983B2 (en) 2015-09-23 2020-09-15 Dolby Laboratories Licensing Corporation Preserving texture/noise consistency in video codecs
EP3369241B1 (en) 2015-10-28 2020-12-09 InterDigital VC Holdings, Inc. Method and device for selecting a process to be applied on video data from a set of candidate processes driven by a common set of information data
US10311558B2 (en) * 2015-11-16 2019-06-04 Dolby Laboratories Licensing Corporation Efficient image processing on content-adaptive PQ signal domain
EP3367657B1 (en) * 2015-12-23 2021-06-02 Huawei Technologies Co., Ltd. Image signal conversion method and apparatus, and terminal device
CN106937121B (zh) * 2015-12-31 2021-12-10 中兴通讯股份有限公司 图像解码和编码方法、解码和编码装置、解码器及编码器
US10165275B2 (en) * 2016-01-26 2018-12-25 Dolby Laboratories Licensing Corporation Content-adaptive reshaping for high dynamic range images
US10223774B2 (en) * 2016-02-02 2019-03-05 Dolby Laboratories Licensing Corporation Single-pass and multi-pass-based polynomial approximations for reshaping functions
US10032262B2 (en) * 2016-02-02 2018-07-24 Dolby Laboratories Licensing Corporation Block-based content-adaptive reshaping for high dynamic range images
CN108885783B (zh) 2016-03-23 2022-02-15 杜比实验室特许公司 编码和解码可逆制作质量单层视频信号
US10397586B2 (en) 2016-03-30 2019-08-27 Dolby Laboratories Licensing Corporation Chroma reshaping
EP3226563B1 (en) * 2016-03-30 2021-06-23 Dolby Laboratories Licensing Corp. Chroma reshaping
US10542296B2 (en) 2016-05-10 2020-01-21 Dolby Laboratories Licensing Corporation Chroma reshaping of HDR video signals
EP3456047B1 (en) * 2016-05-10 2020-02-26 Dolby Laboratories Licensing Corporation Chroma reshaping of hdr video signals
CN109155853B (zh) * 2016-05-19 2023-03-28 杜比实验室特许公司 用于高动态范围图像的色度整形
US10602110B2 (en) * 2016-08-26 2020-03-24 Dolby Laboratories Licensing Corporation Chroma reshaping based on just noticeable differences
WO2018039665A1 (en) * 2016-08-26 2018-03-01 Dolby Laboratories Licensing Corporation Chroma reshaping based on just noticeable differences
EP3507981B1 (en) * 2016-08-30 2023-11-29 Dolby Laboratories Licensing Corporation Real-time reshaping of single-layer backwards-compatible codec
US10507005B2 (en) * 2016-09-22 2019-12-17 General Electric Company Spectral calibration of spectral computed tomography (CT)
KR102636100B1 (ko) * 2016-12-16 2024-02-13 삼성전자주식회사 데드존에 기초하여 양자화를 수행하는 인코더 및 이를 포함하는 비디오 처리 시스템
JP6929373B2 (ja) 2017-03-03 2021-09-01 ドルビー ラボラトリーズ ライセンシング コーポレイション 不均等な色空間における彩度調整
JP7037584B2 (ja) 2017-06-16 2022-03-16 ドルビー ラボラトリーズ ライセンシング コーポレイション 効率的なエンド・ツー・エンドシングルレイヤー逆ディスプレイマネジメント符号化
CN110301134B (zh) 2017-06-29 2024-02-06 杜比实验室特许公司 整合的图像整形和视频编码
EP3669542B1 (en) 2017-08-15 2023-10-11 Dolby Laboratories Licensing Corporation Bit-depth efficient image processing
US10609372B2 (en) 2017-09-29 2020-03-31 Dolby Laboratories Licensing Corporation Up-conversion to content adaptive perceptual quantization video signals
US10778979B2 (en) * 2018-01-11 2020-09-15 Qualcomm Incorporated Signaling mechanisms for equal ranges and other DRA parameters for video coding
US10880531B2 (en) 2018-01-31 2020-12-29 Nvidia Corporation Transfer of video signals using variable segmented lookup tables
EP3753253A1 (en) * 2018-02-14 2020-12-23 Dolby Laboratories Licensing Corporation Image reshaping in video coding using rate distortion optimization
US11310537B2 (en) 2018-02-28 2022-04-19 Dolby Laboratories Licensing Corporation Linear encoder for image/video processing
US10757428B2 (en) 2018-10-10 2020-08-25 Apple Inc. Luma and chroma reshaping of HDR video encoding
US10484784B1 (en) 2018-10-19 2019-11-19 xMEMS Labs, Inc. Sound producing apparatus
US11405582B2 (en) * 2019-06-28 2022-08-02 Meta Platforms, Inc. Preprocessing of high-dynamic-range video using a hybrid lookup table scheme
WO2021216767A1 (en) * 2020-04-22 2021-10-28 Dolby Laboratories Licensing Corporation Iterative optimization of reshaping functions in single-layer hdr image codec
US11516429B2 (en) * 2020-04-22 2022-11-29 Grass Valley Limited System and method for image format conversion using 3D lookup table approximation
US11544826B2 (en) * 2021-04-30 2023-01-03 Realnetworks, Inc. Intelligent metadata service for video enhancement
CN115390780B (zh) * 2022-10-28 2023-02-10 广州市保伦电子有限公司 一种拼接屏配对方法及装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2010105036A1 (en) * 2009-03-13 2010-09-16 Dolby Laboratories Licensing Corporation Layered compression of high dynamic range, visual dynamic range, and wide color gamut video
WO2012108707A2 (en) * 2011-02-09 2012-08-16 Samsung Electronics Co., Ltd. Method and apparatus for brightness-controlling image conversion
WO2012147018A2 (en) * 2011-04-28 2012-11-01 Koninklijke Philips Electronics N.V. Apparatuses and methods for hdr image encoding and decoding
WO2013046095A1 (en) * 2011-09-27 2013-04-04 Koninklijke Philips Electronics N.V. Apparatus and method for dynamic range transforming of images

Family Cites Families (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5313298A (en) 1992-03-05 1994-05-17 Rubin, Bednarek And Associates, Inc. Video companding method and system
US6560285B1 (en) 1998-03-30 2003-05-06 Sarnoff Corporation Region-based information compaction as for digital images
JP2002109523A (ja) 2000-09-28 2002-04-12 Minolta Co Ltd 撮像装置、光学フィルタ群および画像データ変換装置
US7023580B2 (en) * 2001-04-20 2006-04-04 Agilent Technologies, Inc. System and method for digital image tone mapping using an adaptive sigmoidal function based on perceptual preference guidelines
US20030111533A1 (en) 2001-12-19 2003-06-19 Koninklijke Philips Electronics N.V. RGB led based white light control system with quasi-uniform color metric
TW548509B (en) * 2002-11-12 2003-08-21 Novatek Microelectronics Corp Estimation method for white-point offset of the white balance point
JP2005037996A (ja) * 2003-07-15 2005-02-10 Matsushita Electric Ind Co Ltd 画像処理装置および方法
JP2005167962A (ja) * 2003-11-11 2005-06-23 Secom Co Ltd 符号化信号分離装置、符号化信号合成装置および符号化信号分離合成システム
JP2006071332A (ja) 2004-08-31 2006-03-16 Fuji Photo Film Co Ltd 演色性評価方法及びその装置並びにこの演色性評価方法で評価して製造した発光装置
JP5249784B2 (ja) * 2006-01-23 2013-07-31 マックス−プランク−ゲゼルシャフト・ツア・フェルデルング・デア・ヴィッセンシャフテン・エー・ファオ 高ダイナミックレンジコーデック
US8493514B2 (en) 2007-07-16 2013-07-23 Lg Electronics Inc. Apparatus for controlling color temperature
US8019150B2 (en) 2007-10-11 2011-09-13 Kwe International, Inc. Color quantization based on desired upper bound for relative quantization step
CN101282437A (zh) * 2008-04-19 2008-10-08 青岛海信电器股份有限公司 一种解码装置
US8446961B2 (en) * 2008-07-10 2013-05-21 Intel Corporation Color gamut scalability techniques
CN101355634B (zh) * 2008-08-26 2013-06-05 北京中星微电子有限公司 一种调整图像色度的方法和系统
KR101651415B1 (ko) * 2009-03-10 2016-08-26 돌비 레버러토리즈 라이쎈싱 코오포레이션 확장된 동적 범위 및 확장된 차수 이미지 신호 변환
US8390642B2 (en) * 2009-04-30 2013-03-05 Hewlett-Packard Development Company, L.P. System and method for color space setting adjustment
JP5373143B2 (ja) 2010-04-27 2013-12-18 東京エレクトロン株式会社 半導体装置の製造方法並びにコンタクトホール及び/又はラインの埋め込み方法
TWI559779B (zh) 2010-08-25 2016-11-21 杜比實驗室特許公司 擴展影像動態範圍
JP2012108707A (ja) 2010-11-17 2012-06-07 Toyota Motor Corp 制御装置
JP2013046095A (ja) 2011-08-22 2013-03-04 Canon Inc 通信装置
US9451292B2 (en) * 2011-09-15 2016-09-20 Dolby Laboratories Licensing Corporation Method and system for backward compatible, extended dynamic range encoding of video
TWI575933B (zh) 2011-11-04 2017-03-21 杜比實驗室特許公司 階層式視覺動態範圍編碼中之層分解技術
CN106095358B (zh) 2011-12-06 2019-05-14 杜比实验室特许公司 改进不同显示能力之间基于感知照度非线性的图像数据交换的装置和方法
JP5511882B2 (ja) 2012-04-19 2014-06-04 ギガフォトン株式会社 極端紫外光源装置
BR112015020009B1 (pt) 2013-02-21 2023-02-07 Dolby Laboratories Licensing Corporation Gerenciamento de exibição para vídeo de alta gama dinâmica
EP2936814B1 (en) 2013-03-26 2018-03-14 Dolby Laboratories Licensing Corporation Encoding perceptually-quantized video content in multi-layer vdr coding

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2010105036A1 (en) * 2009-03-13 2010-09-16 Dolby Laboratories Licensing Corporation Layered compression of high dynamic range, visual dynamic range, and wide color gamut video
WO2012108707A2 (en) * 2011-02-09 2012-08-16 Samsung Electronics Co., Ltd. Method and apparatus for brightness-controlling image conversion
WO2012147018A2 (en) * 2011-04-28 2012-11-01 Koninklijke Philips Electronics N.V. Apparatuses and methods for hdr image encoding and decoding
WO2012147022A2 (en) * 2011-04-28 2012-11-01 Koninklijke Philips Electronics N.V. Apparatuses and methods for hdr image encoding and decoding
WO2013046095A1 (en) * 2011-09-27 2013-04-04 Koninklijke Philips Electronics N.V. Apparatus and method for dynamic range transforming of images

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
MARTIN WINKEN ET AL.: "Bit-Depth Scalable Video Coding", IEEE INTERNATIONAL CONFERENCE ON IMAGE PROCESSING (ICIP 2007), vol. 1, JPN6016023403, 2007, pages 5 - 8, ISSN: 0003407900 *
MARTIN WINKEN ET AL.: "CE2: SVC bit-depth scalable coding", JOINT VIDEO TEAM (JVT) OF ISO/IEC MPEG & ITU-T VCEG (ISO/IEC JTC1/SC29/WG11 AND ITU-T SG16 Q.6), vol. JVT-X057, JPN6016023401, June 2007 (2007-06-01), pages 1 - 12, ISSN: 0003407901 *
YUANZHEN LI ET AL.: "Compressing and companding high dynamic range images with subband architectures", PROCEEDINGS OF ACM SIGGRAPH 2005, vol. 24, no. 3, JPN7016001641, July 2005 (2005-07-01), pages 836 - 844, ISSN: 0003407902 *
ZICONG MAI ET AL.: "Optimizing a Tone Curve for Backward-Compatible High Dynamic Range Image and Video Compression", IEEE TRANSACTIONS ON IMAGE PROCESSING, vol. 20, no. 6, JPN6016023402, June 2011 (2011-06-01), pages 1558 - 1571, XP011411814, ISSN: 0003407899, DOI: 10.1109/TIP.2010.2095866 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2023502443A (ja) * 2019-11-27 2023-01-24 ドルビー ラボラトリーズ ライセンシング コーポレイション Hdr画像化におけるレート制御認識リシェーピング
JP7391214B2 (ja) 2019-11-27 2023-12-04 ドルビー ラボラトリーズ ライセンシング コーポレイション Hdr画像化におけるレート制御認識リシェーピング

Also Published As

Publication number Publication date
JP2017022737A (ja) 2017-01-26
WO2014204865A1 (en) 2014-12-24
CN106488246B (zh) 2019-06-11
CN105324997A (zh) 2016-02-10
JP6038360B2 (ja) 2016-12-07
US20170085881A1 (en) 2017-03-23
JP2017079471A (ja) 2017-04-27
JP6312775B2 (ja) 2018-04-18
HK1217393A1 (zh) 2017-01-06
JP6181259B2 (ja) 2017-08-16
US9584811B2 (en) 2017-02-28
CN105324997B (zh) 2018-06-29
EP3011741A1 (en) 2016-04-27
US9716887B2 (en) 2017-07-25
CN106488246A (zh) 2017-03-08
EP3011741B1 (en) 2018-03-07
US20160134872A1 (en) 2016-05-12

Similar Documents

Publication Publication Date Title
JP6312775B2 (ja) エンハンストダイナミックレンジ信号の階層符号化のための適応的再構成
JP6302600B2 (ja) 知覚的量子化されたビデオコンテンツの符号化および復号化
US10432955B2 (en) High dynamic range adaptation operations at a video decoder
US10575005B2 (en) Video coding and delivery with both spatial and dynamic range scalability
CN109068139B (zh) 用于环内再成形的方法、设备和计算机可读存储介质
JP2020171022A (ja) 高ダイナミックレンジおよび広色域シーケンスを符号化するシステム
RU2619886C2 (ru) Кодирование перцепционно-квантованного видеоконтента в многоуровневом кодировании vdr
CN108476325B (zh) 用于高动态范围颜色转换校正的介质、方法和设备
EP3069513B1 (en) Pre-dithering in high dynamic range video coding
RU2661309C1 (ru) Межслойное предсказание для сигналов с улучшенным динамическим диапазоном
US10742986B2 (en) High dynamic range color conversion correction
CN108370446B (zh) 具有减小的内插误差的低复杂度查找表构造
US10715772B2 (en) High dynamic range color conversion correction
WO2019071045A1 (en) HIGH DYNAMIC RANGE COLORING CORRECTION

Legal Events

Date Code Title Description
A975 Report on accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A971005

Effective date: 20160614

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20160621

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20160831

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20161004

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20161101

R150 Certificate of patent or registration of utility model

Ref document number: 6038360

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250