JP2017509238A - エンハンストダイナミックレンジを備える信号のための区分的階層間予測 - Google Patents

エンハンストダイナミックレンジを備える信号のための区分的階層間予測 Download PDF

Info

Publication number
JP2017509238A
JP2017509238A JP2016551759A JP2016551759A JP2017509238A JP 2017509238 A JP2017509238 A JP 2017509238A JP 2016551759 A JP2016551759 A JP 2016551759A JP 2016551759 A JP2016551759 A JP 2016551759A JP 2017509238 A JP2017509238 A JP 2017509238A
Authority
JP
Japan
Prior art keywords
predictor
values
video signal
pivot point
piecewise
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2016551759A
Other languages
English (en)
Other versions
JP6253794B2 (ja
Inventor
スゥ,グワン‐ミーン
チェン,チェン
イン,ペン
ヴィレンバッハー,ラルフ
Original Assignee
ドルビー・インターナショナル・アーベー
ドルビー ラボラトリーズ ライセンシング コーポレイション
ドルビー ラボラトリーズ ライセンシング コーポレイション
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ドルビー・インターナショナル・アーベー, ドルビー ラボラトリーズ ライセンシング コーポレイション, ドルビー ラボラトリーズ ライセンシング コーポレイション filed Critical ドルビー・インターナショナル・アーベー
Publication of JP2017509238A publication Critical patent/JP2017509238A/ja
Application granted granted Critical
Publication of JP6253794B2 publication Critical patent/JP6253794B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/137Motion inside a coding unit, e.g. average field, frame or block difference
    • H04N19/139Analysis of motion vectors, e.g. their magnitude, direction, variance or reliability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/105Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/182Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a pixel
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/513Processing of motion vectors
    • H04N19/517Processing of motion vectors by encoding
    • H04N19/52Processing of motion vectors by encoding by predictive encoding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/513Processing of motion vectors
    • H04N19/521Processing of motion vectors for estimating the reliability of the determined motion vectors or motion vector field, e.g. for smoothing the motion vector field or for correcting motion vectors

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

【解決手段】エンハンストダイナミックレンジ(EDR)を備えるビデオシーケンスの画素データが、スタンダードダイナミックレンジ(SDR)を備える対応ビデオシーケンスの画素データと、区分的階層間予測器とに基づき、予測される。区分的予測器の出力パラメータ算出は少なくとも、2組の予計算値と予測コスト基準とに基づく。第1組の予計算値は、全ての入力SDRフレームに適合し、1組のSDR画素値についての1つ以上の整数乗項を含む。第2組の予計算値は、フレーム特有であり、入力SDRフレームのヒストグラムと対応EDRフレームの画素値とに基づき算出される。予計算値によって、区分的多項式用に最適なピボット点を予測コストに準じて同定すること、及び、区分的予測器の係数解を求めることを行う高速反復アルゴリズムが可能になる。

Description

関連出願への相互参照
本出願は、2013年12月4日付け出願のPCT出願第PCT/US2013/073085号に関連し得るものであり、その全文をここに援用する。本出願は、2014年2月13日付け出願の米国仮特許出願第61/939,614号及び2014年6月18日付け出願の米国仮出願第62/013,611号に基づく優先権を主張するものであり、その各々の全文を援用する。
技術
本発明は、広く画像に関係する。より詳細には、本発明のある実施形態は、エンハンスト(enhanced)ダイナミックレンジを備える信号を符号化及び復号化するための区分的階層間予測に関係する。
背景
音声及び動画の圧縮は、マルチメディアコンテンツの開発、格納、配信、消費における重要要素である。圧縮法の選択には、符号化効率、符号化複雑度、及び遅延の間でのトレードオフが伴う。計算コストに対する処理能力の比率が増大するにつれて、より効率的な圧縮を可能にする、より複雑な圧縮技術の開発が可能になる。一例として、動画圧縮において、国際標準化機構(ISO)から派生したMotion Pictures Expert Group(MPEG)は、MPEG‐2、MPEG‐4(パート2)、H.264/AVC(またはMPEG‐4、パート10)、H.265/HEVC符号化標準をリリースすることにより、当初のMPEG‐1動画標準について更なる改良を続けてきた。
映像信号を特徴付け得るものとして、ビット深度、色空間、色域、解像度など、複数のパラメータが挙げられる。現代のテレビや動画再生装置(例えば、ブルーレイプレーヤ)は、標準解像度(例えば、720×480i)や高精細(HD)(例えば、1920×1080p)など、多様な解像度をサポートする。超高精細(UHD)は、次世代の解像度フォーマットであり、少なくとも3,840×2,160解像度(4K UHDと呼称される)を有し、さらにオプションとして7680×4320(8K UHDと呼称される)もの高解像度を有し得る。超高精細は、また、ウルトラHD、UHDTV、あるいはスーパーハイビジョンとも呼称され得る。本明細書中で用いるとき、UHDとは、HD解像度より高い任意の解像度を指す。
映像信号の特徴が持つもう一つの側面は、そのダイナミックレンジである。ダイナミックレンジ(DR)とは、例えば最暗から最明までのような、画像内の強度範囲(例えば、輝度、ルマ)のことである。本明細書中で用いるとき、「ダイナミックレンジ」(DR)という用語は、例えば最暗から最明までのような画像内強度範囲(例えば、輝度、ルマ)に対する、人間の心理視覚システム(HVS)の感知能力に関係し得る。この意味で、DRは「シーン−リファード(scene−referred)」の強度に関係する。DRはまた、ディスプレイ装置がある特定の幅を持つ強度範囲を妥当にまたは近似的に描画する能力にも関係し得る。この意味で、DRは「ディスプレイ−リファード(display−referred)」の強度に関係する。本明細書中の任意の箇所において、ある特定の意味が特に明示的に指定されている場合を除いて、この用語はどちらの意味としても(例えば、区別なく)使用できるものとする。
本明細書において、ハイダイナミックレンジ(HDR)という用語は、人間の視覚システム(HVS)において14〜15桁ほどにわたるDR幅に関する。例えば、しっかりと順応した、実質的に正常(例えば、統計的な意味、バイオメトリック的な意味、または、眼科的な意味の1つ以上において)な人間は、約15桁にわたる強度範囲を有する。順応した人間は、ほんの少量の光子のうす暗い光源を知覚し得る。また、同じ人間が、砂漠、海または雪上における真昼の太陽の、目が痛くなるほどの明るい強度を知覚し得る(また、怪我をしないような短時間であるとしても太陽を見ることもできる)。ただし、この範囲は、「順応した人間」、例えば、そのHVSをリセットして調節する時間を経た人間に当てはまるものである。
これに対して、人間が、広範囲の強度範囲を同時に知覚し得るDRは、HDRに対して幾分端折られ得る。本明細書において、「エンハンストまたは拡張ダイナミックレンジ」(EDR)、「視覚的ダイナミックレンジ」、あるいは「可変ダイナミックレンジ」(VDR)という用語は、個々にまたは区別なく、HVSによって同時に感知可能なDRに関係し得る。本明細書において、EDRは、5〜6桁にわたるDRに関連し得る。従って、真のシーンリファードのHDRに対して幾分狭いものの、EDRは、広いDR幅を示す。本明細書において、「同時的(simultaneous)ダイナミックレンジ」という用語は、EDRに関係し得る。
実際には、画像は1つ以上の色成分(例えば、輝度Y、及び色差CbとCr)を含み、各色成分は1画素あたりnビット(例えば、n=8)の精度で表される。線形輝度符号化を用いれば、n≦8であるような画像(例えば、カラー24ビットJPEG画像)は、スタンダードダイナミックレンジを持つ画像と考えられる。一方、n>8であるような画像は、エンハンストダイナミックレンジを持つ画像と考えられ得る。EDR及びHDR画像はまた、低ビット深度非線形輝度符号化(例えば、10ビット対数輝度符号化)あるいは、例えばIndustrial Light and Magic社が開発したOpenEXRファイルフォーマットのような、高精度(例えば、16ビット)浮動小数点フォーマットを用いて、格納されまた配信され得る。
新しいHDRまたはUHDディスプレイ技術だけでなく、旧式の再生装置に対する後方互換性をも同様にサポートするために、複数のレイヤを利用し、UHD及びHDR(またはEDR)動画データを上流側装置から下流側装置へと配信し得る。そのようなマルチレイヤストリームを与えられると、旧式のデコーダは、ベースレイヤを用いてコンテンツのHD SDR版を再構成し得る。新型のデコーダは、ベースレイヤおよびエンハンスメントレイヤの両方を用いて、より能力の高いディスプレイ上での描画のために、コンテンツのUHD EDR版を再構成し得る。本発明者らが認識するところでは、特に階層間予測に関する部分において、EDR動画を階層的に符号化するための改良技術が望まれる。
本節に記載されている手法は、探求し得る手法ではあるが、必ずしもこれまでに着想または探求されてきた手法ではない。従って、別途示唆のない限り、本節に記載された手法のいずれも、本節に記載されているという理由だけで従来技術としての適格性を有すると考えるべきではない。同様に、別途示唆のない限り、1以上の手法に関して特定される問題が、本節に基づいて、いずれかの先行技術において認識されたことがあると考えるべきではない。
図面の簡易説明
同様の部材に同様の参照符号を付した添付図面の各図において、本発明のある実施形態を限定する事なく例示する。
図1は、本発明のある実施形態による階層間予測器を備えた階層的EDR符号化システムの実装例を表す。 図2は、本発明の実施形態による区分的階層間予測器の生成工程例を表す。 図3は、本発明の実施形態による区分的階層間予測器の生成工程例を表す。
実施形態例の説明
エンハンストダイナミックレンジを備える信号の階層的符号化に適用する際の階層間予測を、本明細書に記載する。ベースレイヤ(BL)SDR信号及び残差EDRエンハンスメントレイヤ(EL)を用いて符号化され得るEDR入力映像信号が与えられると、少なくともSDR BL信号のヒストグラムと対応EDR信号の統計とに基づき、予め計算されたルックアップテーブルを用いて、それら2層間の高速な区分的階層間予測器が構築される。
以下の説明においては、便宜上、本発明を完全に理解できるように、多数の詳細事項を説明する。ただし、これらの詳細事項抜きでも本発明を実施可能であることは明白であろう。他方、本発明の説明を不必要に不明瞭にしないように、周知の構造およびデバイスの細かな詳細までは説明しない。
概要
本明細書の実施形態例は、エンハンストダイナミックレンジを備えた映像信号を階層的に符号化及び復号化する際の、区分的階層間予測に関係する。
エンハンストダイナミックレンジ(EDR)を備えたビデオシーケンスの画素データが、スタンダードダイナミックレンジ(SDR)を備えた対応する入力ビデオシーケンスの画素データに基づき、区分的階層間予測器を用いて予測される。区分的予測器のパラメータは、少なくとも予め計算されたルックアップテーブル(LUTs)と予測コスト基準とに基づき、算出される。第1のLUTは、ビデオシーケンス内で固定ビット深度を持つ全ての入力SDRフレームに適合し、1組の可能なSDR画素値につき、1つ以上の整数乗項を予め計算した値を含む。第2のLUTは、フレーム毎に特有であってもシーン毎に特有であってもよく、入力SRDフレームのヒストグラムと対応EDRフレームの画素値とに基づいて予め計算された値を含む。これら予め計算されたLUTによって、区分的多項式用に最適なピボット点を予測コストメトリックに準じ同定すること、及び、随伴する区分的多項式の係数解を求めることを行う、高速反復アルゴリズムが可能となる。
ある実施形態では、区分的予測器は、2次多項式を用いる。また、予測コスト基準は、推定EDR画素値と入力EDR画素値との間の平均2乗誤差に基づく。
ある実施形態では、現在のフレーム用の第2のLUTは、現在のSDR及びEDRフレームと、現在のフレームに先行するSDR及びEDRフレームとの、両方の画素特徴を考慮に入れて算出される。
ある実施形態では、2番目のピボット点と最後から2番目のピボット点との間の区分は、全て同じ長さを有する。また、各区分は、1次または2次の多項式の内、いずれか一方を用いて近似される。
EDR信号の階層的符号化
例えばHDTV、セットトップボックス、あるいはブルーレイプレーヤのような、既存のディスプレイ及び再生装置は、典型的には1080pのHD解像度(例えば、毎秒60フレームで1920×1080)までの信号をサポートする。消費者対象のアプリケーション向けに、そのような信号は現在、典型的には、各画素各色成分毎に8ビットのビット深度を用いて輝度−色差色形式に圧縮される。その際、典型的には、色差成分は輝度成分よりも低い解像度を持つ(例えば、YCbCrあるいはYUV4:2:0色形式)。8ビット深度及びそれに対応する低ダイナミックレンジのため、そのような信号は、典型的には、スタンダードダイナミックレンジ(SDR)を備える信号と呼ばれる。
超高精細(UHD)のような、新たなテレビ規格が開発されつつある今、エンハンスト解像度および/またはエンハンストダイナミックレンジを備える信号を、旧式のHDTVデコーダとより最近のUHDデコーダとの両方が処理可能な形式で、符号化することが望ましいと言える。
その全文を本願に援用する、G‐M Su他による2013年12月4日付け出願のPCT出願第PCT/US2013/073085号、「Backward compatible coding for ultra‐high definition signals with enhanced dynamic range」に記載の通り、図1は、エンハンストダイナミックレンジ(EDR)を備えるUHD信号の後方互換な符号化をサポートするシステムにつき、実装例の実施形態を示している。エンコーダは、ベースレイヤ(BL)エンコーダ(130)及び、エンハンスメントレイヤ(EL)エンコーダ(160)を含む。ある実施形態では、BLエンコーダ(130)は、例えばMPEG‐2やH.264エンコーダのような、旧式のエンコーダであり、ELエンコーダ(160)は、例えばHEVCエンコーダのような、新規格エンコーダである。旧式のBLデコーダをサポートするため、BLエンコーダ(130)は、典型的には8ビットエンコーダである。しかし、ELエンコーダ(160)は、より高いビット深度を備えた入力ストリームをサポートし得る。例えば、H.264及びHEVC(H.265)標準が規定するように、10ビットでもよい。しかし、本システムは、任意の空間解像度におけるEDR及びSDR層の符号化に適用可能であり、既知のまたは将来のエンコーダをどのような組合せで用いてもよく、それらが規格準拠か独自開発かは問わない。
図1に示すように、映画やテレビ放送のようなある1つの入力信号は、2つの信号で表し得る。すなわち、UHD EDR入力(102)及びUHD SDR入力(104)である。例えば、UHD EDR信号(102)は、HDRカメラにより撮影され、EDRディスプレイ用にカラーグレーディングを受けた、4K(例えば、3840×2160)解像度信号であり得る。その同じ信号はまた、4K SDRディスプレイ上でカラーグレーディングを受けて、対応する4K SDR信号(104)を生成し得る。あるいは、SDR信号(104)は、当該技術において既知のトーンマッピングやディスプレイマネジメント技術の内、いずれをEDR信号に対し適用することによっても生成され得る。一般的にそうだというわけではないが、典型的には、これらの入力信号は両方とも、16ビットまたは同等の(例えば、浮動小数点)ビット深度表現を用いるRGB色空間で表現され得る。本明細書中で用いる際、nビット信号という用語が指すのは、1つ以上の色成分(例えば、RGBまたはYCbCr)を備えており、しかもこれら色成分の内どの1つ(例えば、Y)においても各画素がnビット画素値で表現されるような、画像または映像信号のことである。nビット表現において、そのような各画素は、0から2n−1までの間の値を取り得る。例えば、8ビット表現においては、各色成分につき、各画素はそれぞれ0から255までの間の値を取り得る。
ある実施形態では、UHD SDR信号(104)は、HD SDR信号(例えば、1080p)へとダウンサンプルされてもよく、それから、例えば8ビットYCbCr4:2:0色形式のような、旧式の8ビットエンコーダを利用して符号化するのに適した色形式へと色変換される。そのような変換は、色変換(例えば、RGBからYCbCrへの変換115‐C)やクロマサブサンプリング(例えば、4:4:4から4:2:0への変換120‐C)を含み得る。このように、HD SDR信号(128)は、元々のUHD EDR信号(102)についての後方互換な信号表現を表す。信号(128)は、BLエンコーダ(130)により符合化されて、後方互換な符号化ビットストリーム(132)を生成し得る。BLエンコーダ(130)は、HD SDR信号(128)を圧縮または符号化するために、既知のあるいは将来の動画圧縮アルゴリズムの内のいずれを用いても良く、MPEG‐2、MPEG‐4(パート2)、H.264、HEVC、VP8、VP9等が、その例として挙げられる。
UHD EDR信号(102)が与えられると、ダウンサンプリング(110‐A)及び色変換の工程(115‐Bと120‐B)は、UHD EDR信号(102)を参照予測HD EDR信号(124)へと変換し得る。ある好ましい実施形態では、この段階におけるダウンサンプリングと色変換の工程(110‐A、115‐B、及び120‐B)(例えば、選択されたフィルタと色空間)は、ベースレイヤにHD SDR信号(128)を生成するために用いたダウンサンプリングと色変換の工程(110‐B、115‐C、及び120‐C)と同一、もしくは可能な限り近いものであるべきである。
UHD EDRからHD EDRへの変換に続いて、HD EDR信号(124)の出力は、輝度(Y 124‐Y)成分と色差(CbCr 124‐C)成分とに分離され、輝度予測器(145)及び色差予測器(140)用予測係数の決定に適用される。
HD SDR信号(128)が与えられたとき、BLエンコーダ(130)により生成されるのは、符号化BLビットストリーム(132)だけではない。対応するBLデコーダによって復号化されるであろうようにHD SDR信号(128)を表現するBL信号(126)もまた生成される。いくつかの実施形態では、信号(126)は、BLエンコーダ(130)の後に続く別個のBLデコーダ(不図示)により生成され得る。他のいくつかの実施形態では、信号(126)は、BLエンコーダ(130)において動き補償を行うために用いられるフィードバックループから生成され得る。図1に示すように、HD EDR信号(126)出力もまた、その輝度成分(Y 126‐Y)と色差成分(CbCr 126‐C)とに分離され得て、HD EDR´の信号(147)を予測する目的で、輝度予測器(145)と色差予測器(140)とに対し適用される。他のいくつかの実施形態では、ダウンサンプリング(110‐A、110‐B)はスキップされ得て、その結果、全ての工程がフル解像度で行われることとなる。
ある実施形態では、輝度予測器(145)は、HD EDR´信号(147)が有する輝度成分をベースレイヤのHD SDR信号が有する輝度画素値(126‐Y)に基づき予測する多項式予測器を含む。そのような予測器では、当該信号についてその他のいかなる色成分におけるいかなる画素値をも考慮に入れることなく、輝度画素成分が予測され得る。例えば、siがBL HD SDR信号の有する輝度画素値(126‐Y)を表すものとすると、一般性を失うことなく、3次の多項式予測器は、
Figure 2017509238
と表され得る。但し、上式で、ak(k = 0, …, 3)は予測器の係数である。ある実施形態では、予測器の係数は、当該技術において既知である任意の誤差最小化技法によって決定され得る。例えば、予測値
Figure 2017509238
と参照HD EDR信号内の輝度画素値(124‐Y)(vi)との間の平均2乗誤差(例えば、
Figure 2017509238
)を最小化してもよい。
ある実施形態では、色差予測器(140)もまた、先述のものと同様の多項式予測器であり得る。しかし、ある好ましい実施形態では、色差予測器(140)は、その全文を本願に援用する、2012年4月13日付け出願のPCT出願第PCT/US2012/033605号(WO2012/142471として公開)、「Multiple color channel multiple regression predictor」において、G‐M Su他によって記載されているような、マルチカラーチャンネル多重回帰(MMR)予測器を含み得る。MMR予測器は、HD EDR´の信号が有する色差成分を予測するのに、HD EDR参照信号(124)及びベースレイヤHD SDR信号(126)内にある、輝度及び色差画素値の両方に由来する情報を使用する。MMRモデルにおける予測係数もまた、平均2乗誤差最小化技法を用いて、予測クロマ値と、参照HD EDR信号(124)が有する輝度及び式差画素値との間のMSEを最小化することにより、決定され得る。
HD SDR信号(126)及び参照HD HDR信号(124)の両方がYCbCr4:2:0形式であり、輝度成分の空間解像度が各式差成分の空間解像度の2倍であるので、これら両信号の輝度成分は、色差予測器(140)に適用される前にダウンサンプルされる(135‐A及び135‐B)。好ましい実施形態では、輝度ダウンサンプリング(135‐A)及び(135‐B)に用いられるフィルタは、4:4:4から4:2:0への処理工程(120)で用いられる色差ダウンサンプリング用フィルタと同一である。輝度及び色差予測係数は、シーン毎、ピクチャーグループ毎、フレーム毎など、考察対象とする様々な時間間隔をおいて更新され得る。予測フィルタ係数は、様々な手法を用いてビデオデコーダに伝達され得る。例えば、それらの値を、補助データあるいはメタデータとしてビットストリーム内に埋め込んでもよい。
予測HD EDR´信号(147)が与えられると、アップサンプラ(150)はUHD EDR´信号(152)を生成し、その信号は残差信号(167)を生成するために使用される。UHD EDR´の信号は好ましい符号化形式(例えば、YCbCr4:2:0)で表現されているので、追加的な色変換(115‐A)及び色差ダウンサンプリング(120‐A)のステップが、当初のUHD EDR信号(102)を当初の形式(例えば、RGB)から好ましい符号化形式で表現されたUHD EDR信号(122)へと変換するために、必要となり得る。信号(122)と(152)とは減算されて、EL残差信号(167)を生成する。
ある実施形態では、色変換(115‐A)及びクロマサブサンプリングの工程(120‐A)は、BL符号化信号(128)及び予測信号(124)の生成に用いられている色変換(115‐Bと115‐C)及びクロマサブサンプリングの工程(120‐Bと120‐C)と同一または可能な限り近い。
ある実施形態では、ELエンコーダ(160)によるEL信号(167)の符号化の前に、当該信号は、非線形量子化器(NLQ)(155)によって処理され得る。適当な非線形量子化器の例は、その全文を本願に援用する、2012年4月24日付け出願のPCT特許出願番号第PCT/US2012/034747号(WO2012/148883として公開)、「Non‐Linear VDR Residual Quantizer」の中に見い出し得る。NLQ(155)の出力は、適当なデコーダに送信され得る符号化ELビットストリーム(162)を生成するために、ELエンコーダ(160)を用いて圧縮され得る。さらに、いくつかの実施形態では、残差(167)もまた、ダウンサンプリングモジュール(不図示)によって空間的にダウンサンプルされ得る。そのようなダウンサンプリング(例えば、両次元につき2倍または4倍)は、符号化効率を向上させる。特に非常に低いビットレートにおいては、そうである。ダウンサンプリングの実行は、非線形量子化器(155)の前でも後でもよい。
ELエンコーダ(160)は、例えば、MPEG‐2、MPEG‐4、H.264、HEVC、その他の仕様が記述するような、任意の適切なエンコーダで有り得る。ある実施形態では、BL符号化ビットストリーム(132)、EL符号化ビットストリーム(162)、及び符号化工程に関連するメタデータ(例えば、予測器のパラメータやルックアップテーブル)は、多重化されて単一のビットストリーム(不図示)とされてもよい。
いくつかの実施形態では、ベースラインのHD SDR信号(128)は、既に正しい解像度と色形式を持つ状態でエンコーダ(100)に利用可能であってもよい。そのような場合、ダウンサンプリング(110‐B)及び色変換のステップ(115‐C及び120‐C)は、迂回され得る。
いくつかの実施形態では、UHD EDR信号(102)は、16ビットよりも低いまたは高い精度を持つ状態で利用可能であってもよい。しかし、その精度は、8ビットよりは高い(例えば、10ビットや12ビット)と予想される。同様に、UHD SDR信号(104)は、既に16ビットより低い(例えば、8ビットや10ビット)精度を持つ状態で利用可能であり得る。
区分的階層間予測
背景と用語集
sjiは、あるSDR信号(例えば、126‐Y)に所属のフレームjにおける第i番目画素を表すものとする。vjiは、それに対応する、EDR信号(例えば、124‐Y)内の同位置の画素を表すものとする。
Figure 2017509238
は、それに対応する、同位置の「予測」EDR画素(例えば、147)を表すものとする。所与の画像がP個の画素を有するものとする。限定的な意味ではなく述べるが、2次多項式予測器であるとすると、第i番目画素について、予測値は、
Figure 2017509238
のように表され得る。但し、各i = 0, 1, 2に対し、mjiは予測係数を表す。
ある実施形態では、予測係数は、予測コスト関数を用いて歪みのメトリックを最小化するべく決定され得る。予測コスト関数の例としては、本来のEDR画素値と予測EDR画素値との間の平均2乗誤差(MSE)(例えば、
Figure 2017509238
)が挙げられる。等式(2)は、行列/ベクトル形式で、
Figure 2017509238
のように表現され得る。但し、
Figure 2017509238
である。このとき、最小2乗解は、
Figure 2017509238
として、得られる。但し、
Figure 2017509238
は、参照EDR画素値(124)を表す。Bj及びajを、
Figure 2017509238
及び、
Figure 2017509238
と定義すると、等式(4)より、
Figure 2017509238
となる。
ある実施形態では、予測器(例えば、145)の性能は、区分的な多項式予測を用いて改善できるかも知れない。そのような実施形態では、可能なSDR画素値の全範囲に対して単一の多項式予測器(例えば、等式(1)や(2)に示されるような)を用いる代わりに、SDR画素範囲(例えば [0, K-1]、但しK = 2SDR_BIT_DEPTH)を2つ以上のサブ範囲へと分割し、それから各サブ範囲に対しそれぞれの予測器を適用し得る。そのような実装において、それらの異なる区分的多項式予測器を分離する「ピボット」すなわち境界となる点を見つける必要がある。例えば、区分的な多項式予測が2つの多項式を使用するならば、動画予測において、SRD範囲を2つの範囲[0, sjv)及び[sjv, K-1)に区分するような、SDR変域内のピボット点sjvを同定する必要がある。区分的多項式は、線形でも非線形でもよく、全てが同次数でも、異なる次数でもよい。
一般性を失うことなく、ある区分的多項式予測器が2つの2次多項式(例えば、各多項式は等式(2)に述べられたものと同様である)を使用するものとする。すると、あるピボット点sjvを所与のものとして、下位区分にはL個の画素が、上位区分にはH個の画素があり、P=L+Hが成り立つことになる。ある入力画素sjiが与えられたとすると、予測工程は、下記のように記述され得る。
Figure 2017509238
但し、
Figure 2017509238
は、それぞれ下位区分及び上位区分で用いられる予測器係数である。
先と同じ手法を用い、
Figure 2017509238
を所与のものとすると、MSE解は、
Figure 2017509238
及び
Figure 2017509238
のように表せる。但し、
Figure 2017509238
を所与のものとして、slj,iは、その全てがslj,i < sjvを満たすようなSDR画素を表し、vlj,iはそれに対応するEDR画素値を表す。同様に、
Figure 2017509238
を所与のものとして、shj,iは、その全てがshj,i ≧ sjvを満たすようなSDR画素を表し、vhj,iはそれに対応するEDR画素値を表す。出力ピボット点sjvは、全ての可能なピボット点についてMSEを算出した後、最小の対応MSEを有するピボット点を選出することにより決定され得る。
いくつかの実施形態では、区分的多項式予測器を導くために、追加的な制限が適用され得る。例えば、ある実施形態では、ピボット点(sjv)における連続性制限を所与のものとすると、高位部分の予測関数係数は、
Figure 2017509238
と表され得る。ここで、
Figure 2017509238
と置けば、
Figure 2017509238
が成り立つ。
高速アルゴリズム
区分的な多項式を解き求め、可能性のある各ピボット点についてそれぞれ随伴するMSEを算出することは、非常に多大な計算負荷となり得る。より高速な態様を、次に述べる。
ピボット点候補sjvについて考える。
Figure 2017509238
と置くと、各成分は
Figure 2017509238
と表せる。同様に、
Figure 2017509238
と置くと、各成分は
Figure 2017509238
と表せる。
高位の区分につき、
Figure 2017509238
Figure 2017509238
と置くと、各成分は、
Figure 2017509238
と表せる。ここで、bj,mn及びajm(単一多項式予測器の係数を解き求めるために用いられる)の値は、等式(19)及び(21)をL = Pに対して適用することにより、算出可能である。
等式(18)〜(22)より、下記のことが窺える。
1.
Figure 2017509238
の値は、ピボット点が動くとき変化する。一方、SRD値sjiが採り得る値の数は、高々K個までしか許されない。
a.
Figure 2017509238
bに等しい各SDR画素値についての階級度数(bin count)をhbで表す。すなわち、
Figure 2017509238
の集まりは、j番目のSDRフレーム内画素値についてのヒストグラムを表す。
b.
Figure 2017509238
の値は、予め計算されて1つ以上のルックアップテーブル(LUT)に格納され得る。これらの値は、一度だけ計算すればよい。なぜならば、当該SDR入力信号が有する固定ビット深度に対し、可能な値はK個しかないからである。ある実施形態では、それらの予め計算された値(予計算値)は、システムが初期化する際に得られ、従って、これにより
Figure 2017509238
の高速な予計算が可能となる。
c.
Figure 2017509238
の値は、ヒストグラム(例えば、hb値群)及び予計算tb値群を用いて、
Figure 2017509238
のように導かれ得る。
d. フレームj内にあるEDR画素値の内、ヒストグラムの階級bに属するSDR画素値に対応するものについての、和及び2乗和(つまり「エネルギー」)を
Figure 2017509238
で、表すものとする。これらの値もまた、1つ以上のLUT内に予め計算済みで有り
得る。すると、
e.
Figure 2017509238
は、
Figure 2017509238
のように表し得る。
従って、各ピボット点候補につき、値
Figure 2017509238
は、予計算データに対しごくわずかな乗算及び加算を行うだけで導くことができる。
Figure 2017509238
の値を所与のものとして、
Figure 2017509238
の値は、等式(24)から直接得ることができる。最終的に、予測器係数は、
Figure 2017509238
のように、導かれ得る。等式(24)において、bj,mn及びajmの値(単一予測器の係数生成に用いられる)は、等式(27)及び(29)をL = Pかつsjv = Kに対して適用することにより算出可能であることに、注意されたい。
上記2つの多項式が与えられてもなお、対応する歪みメトリック総計(例えば、MSE)を算出する必要がある。反復計算アプローチにより、これらの計算量もまた削減できる。例えば、低位区分のMSEを、
Figure 2017509238
と表すとする。各項は、予め計算されたLUTを用いて、簡素化して計算し得る。その結果、
Figure 2017509238
となる。同様に、高位区分に対しては、
Figure 2017509238
であることが示される。一例として、歪みメトリック総計が
Figure 2017509238
と定義されるものとすると、出力(すなわち、あるコスト基準下で最適の)ピボット点は、Djが最小のときに選出される。すなわち、
Figure 2017509238
となる。以上の計算ステップは、図2に要約される。
図2が示すのは、ある実施形態による、区分的階層間予測器における多項式区分と最適ピボット点の高速導出工程例である。ステップ(202)において、1つ以上のルックアップテーブル(LUT)が生成され、第1組の予計算値群(例えば、等式(26)の
Figure 2017509238
値群)を格納する。ある所与の固定SDRビット深度につき、これらの表は、SDR入力ビデオシーケンスが有するどのフレームに対しても適用可能である。ステップ(206)〜(216)は、区分的予測器の生成が必要なときにはいつでも、入力EDR及びSDRデータ(例えば、(201)及び(203))に対して繰り返され得る。ステップ(206)において、所与のフレームjにつき、SDR値のヒストグラムhb及び対応EDRデータ統計(例えば、等式(25)及び(28)における
Figure 2017509238
の値)が、第2組の予計算値を生成すべく算出され得る。次に、ステップ(208)において、所与のピボット点可能範囲内に納まる、あるピボット点候補sjvが選択される。
ある実施形態では、sjvは、範囲[0, K-1]内に納まるように選択される。しかし、代替的な境界点を用いることにより、計算はさらに簡素化され得る。例えば、フレームj内の画素値は、最小及び最大画素値、例えばMinSDR(j)及びMaxSDR(j)により有界であり得る。このとき、ピボット点の探索は、[MinSDR(j), MaxSDR(j)]の範囲内に限定され得る。
さらに、動画フレームの連続シーケンス内(例えば、シーンや「カット」内)では、フレームj用の最適ピボット点は、ある先行フレーム用の最適ピボット点(例えば、
Figure 2017509238
のある近傍内に納まる可能性が非常に高い。よって、最適ピボット点の探索は、範囲[search_low, search_high]内に限定され得る。但し、所与の閾値deltaに対し、
Figure 2017509238
である。
ピボット点候補sjvを所与のものとすると、まず予計算値及びLUTを利用して
Figure 2017509238
を算出し、その後、先の説明の予測器係数
Figure 2017509238
((27)〜(30)を参照)、及び対応予測値
Figure 2017509238
(例えば、等式(10)を参照)を生成できる。
ステップ(212)において、各ピボット点候補につき、歪みのメトリック(例えば、等式(32)〜(33)におけるMSE)が算出される。ステップ(210)及び(212)は、考慮下の全てのピボット点候補について繰り返される。全てのピボット点候補を算出し終えると、ステップ(216)において、出力ピボット点、典型的には、計測される歪みの最小値を与えるもの、が生成される。
連続性制限付の区分的多項式
先の説明は、ピボット点における連続性制限が下位及び上位の多項式間に課される場合にも、拡張され得る。下位区分についての計算は変わらない。上位区分については、ある実施形態では、下記の等式が適用され得る。
Figure 2017509238
は、上位多項式が連続性制限を満たす場合を表すものとする。このとき、
Figure 2017509238
につき、各成分は、
Figure 2017509238
のように表せる。先に算出されたのと同じ
Figure 2017509238
値が同様に適合するが、添字をずらして用いられることに注意されたい。
同様に、
Figure 2017509238
の成分は、
Figure 2017509238
のように表せる。
Figure 2017509238
を所与のものとして、実際の予測器係数は、等式(15)にあるように算出される。
当該技術に熟練した当業者ならば、連続性制限を実施するための方法が他にも多数あることが理解される。例えば、ある実施形態では、まず最初に高位区分の多項式を決定し、その後、低位区分の多項式を、連続性制限を用いて決定し得る。
演算の計算的複雑さを軽減するため、以上の技法は、他の技法と組み合わせ得る。例えば、SDR値のヒストグラムhb 、及び対応EDRデータ統計
Figure 2017509238
は、フレーム内の全ピクセル値の内、ほんの一部だけを用いて算出し得る。例えば、ある実施形態では、これらの値は、p個毎に1個の画素(例えば、p = 2)のみを用いて算出し得る。
予測器の経時的安定性
実際には、EDRソース(102)が与えられると、SDR画像(例えば、104)は、1シーン毎に、カラリストまたはカラーマッピングソフトウェアもしくはその両方の組み合わせにより生成される。理想的な予測器は、シーンベースであるのかも知れない。しかし、そのような工程のためには、シーン内の全フレームに注目することが必要であり、それ故、莫大な記憶容量が必要となり得る。予測器がフレームベースなら、予測器の突然の変化は、効率的符号化が困難な残差(167)を、結果的に招き得る。特に、低いビットレートにおいては、そうである。このとき、変化の量を制御することが好ましいと言える。擬似コードを用いれば、以上のことは、次のように表し得る。
Figure 2017509238
ある別の実施形態では、ヒストグラム及びEDR統計データは、最後のF個のフレームについて各フレーム毎に格納され得る。すると、予測器はこれらデータについての関数を利用し得る。例えば、擬似コードを用いて、以上のことは次のように表し得る。
Figure 2017509238
但し、c1n, c2n, c3n(n = 0, …, F)は、既定の重みである。画像及び動画処理分野の当業者ならば、等式(37)における線形荷重関数は、その他の線形または非線形関数で代用し得ることが理解される。
2区分の多項式に関して先に説明された技法は、2つを越える多項式を備える予測器へと、容易に拡張できる。例えば、2つのピボット点sjv1及びsjv2を備える、3区分の区分的予測器の場合について考える。低位多項式の構築は、sjv1 = sjvを満たす2区分の多項式における低位多項式の構築と同じである。高位多項式の構築は、2区分の多項式における高位多項式の構築と同じであるが、sjv2から開始する。また、中位多項式の構築は、2区分多項式における高位多項式の構築と同じであるが、終端はsjv2に採る。
探索アルゴリズムは、sjv1とsjv2との可能で適正な組合せを全て調べてもよいし、あるいは、探索時間を軽減するために、その他の発見的手法及び既定事項を用いてもよい。例えば、ある実施形態では、SDR画素のヒストグラムを用いて、画素を「黒」、「中間色」、及び「強調色」に分類する手助けとした後に、これらの範囲を用いて区分的多項式用境界の探索範囲を限定し得る。
代替コスト基準
図1に示すように、予測誤差(167)は、ELエンコーダ(160)により、エンハンスメントレイヤ内に符号化される。符号化の際、予測誤差のダイナミックレンジが重要である。なぜなら、レンジが小さいほど、必要な量子化単位も小さくなり、従って、生み出される量子化歪みもそれだけ小さくなるからである。ある実施形態では、ピボット点(sjv)を発見する問題は、正の最大及び負の最小の予測誤差間の差異を最小化するべく定式化され得る。
このピボット点(sjv)に基づく予測値を、
Figure 2017509238
と表すとする。すると、解は、次のようにして得られる。各ピボット候補につき、1つは低位区分用、1つは高位区分用であるような、2つの多項式を用いた解について再考する。ある実施形態では、コスト関数が
Figure 2017509238
で表されるものとする。但し、
Figure 2017509238
は、ピボット点候補についての推定誤差(例えば、167)を表す。すると、最適ピボット点は、すべてのピボット点候補の内、最小の
Figure 2017509238
を与える点
Figure 2017509238
であり得る。
当該技術に熟練した当業者ならば、本説明の手法は、入力または出力(予測)信号のダイナミックレンジやビット深度のいずれをも制限することなく、様々な他の予測器に適用し得ることが理解される。例えば、いくつかの実施形態では、SDRからSDR信号への予測器、EDRからSDR信号への予測器、あるいはEDRからEDR信号への予測器を設計するために、同様のアプローチを用い得る。
高速多区分予測器
全探索を用いて最適ピボット点を探索すると、大変な時間が掛かり得る。いくつかの実施形態では、区分の数は増やしつつも、準最適化決定されたピボット点を用いることが、有利に働くかも知れない。ある実施形態では、(例えば、8区分を用いる)多区分予測器は、概ね等間隔のピボット点を用いて定義された1次または2次の多項式を使用する。前と同様に、予測多項式を算出するのに、予め計算されたLUTを利用する。さらに、多項式は、重複部分を有するtraining区分由来の利用可能な画素を用いて、算出される。
siは、SDRデータ内のカラープレーンにおけるi番目の画素であるとする。また、vjは、元EDRデータ内の同じカラープレーンにおけるj番目の画素であるとする。ベースレイヤ(BL)内のビット深度をSDR_BIT_DEPTHで表すとする。このとき、BL内のカラープレーンにおいて画素が取り得る値の個数は、K = 2SDR_BIT_DEPTH個である。ある実施形態において、高速な多区分予測器は、2段階を経て構築され得る。a)1組のピボット点群が、決定される。b)生成されたピボット点群を所与のものとして、1組の2次または1次多項式群が、決定される。
A. ピボット点の選出
M +1個のピボット点(例えば、M = 8)により決定された、M個の区分を考える。それら区分点を、
Figure 2017509238
と表す。限定的な意味ではないが、非正規化BLデータについて、
Figure 2017509238
であるものとする。限定的な意味ではないが、各区分は左に閉で右に開、すなわち
Figure 2017509238
であると考えてよいことに留意されたい。ある実施形態では、処理計算を高速化すべく、2番目のピボット点と最後から2番目のピボット点との間の全ピボット点につき、2ピボット点間の距離は同一になるように定められる。しかし、当該技術に通常の熟練を有する当業者ならば、他の不均等分割方式を適用してもよいことが、理解される。
ある実施形態では、ピボット点は、下記のように決定し得る。
a)計算する。
Figure 2017509238
// 対象画素領域j(例えば、あるフレームの一領域、あるフレーム全体、または複数フレームのシーケンス)における最小SDR値。
Figure 2017509238
// 対象画素領域における最大SDR値。
Figure 2017509238
と置く。
b)続いて、ピボット点のリストを、
Figure 2017509238
のように構築する。
典型的な予測器では、ある区分
Figure 2017509238
を所与のものとして、予測係数は、当該区分のみに由来する利用可能な画素を用いて、決定されるであろう。しかし、ある実施形態では、予測器係数は、隣接区分の画素値も同様に用いることにより決定され得る。例えば、範囲
Figure 2017509238
内に納まる画素値のことであり、ここでΔL及びΔhは重複要素(Overlapping factor)である。これにより、2つの隣接予測多項式間での、より滑らかな遷移が可能となる。
B.区分的多項式の決定
先と同じ説明に従い、図3は、ある実施形態例による、区分的多項式の決定工程例を示している。
ステップ(302)において、第1組の予計算値が、SDR入力のビット深度に基づき、初期化される。ステップ(202)におけるのと同様に、第1組の予計算値(例えば、等式(26)の
Figure 2017509238
値群)を格納する1つ以上のLUTが、生成される。ある所与の固定SDRビット深度につき、これらの表は、SDR入力ビデオシーケンス(201)に所属するいずれのフレームにも適用可能である。
ステップ(306)において、ある所与のフレームjにつき、SDR値のヒストグラムhb及び対応EDRデータ統計(例えば、等式(25)及び(28)における、
Figure 2017509238
の値)が、第2組の予計算値を生成すべく算出され得る。
ステップ(310)は、等式(39)及び(40)を用いて算出されたピボット点リストを用いて定義される各区分について、計算される。ステップ(310)は、a)先頭区分のための、及びb)後続の各区分のための、2つの分離した部分工程に分割し得る。
先頭区分の工程
先頭区分につき、予測器係数は、拡張範囲
Figure 2017509238
を持つtraining区分の画素から導かれる。あるいはこの範囲は、2変数α=0、
及び、
Figure 2017509238
を用いて、適正データ範囲外の画素が用いられるのを防ぐべく定義され得る。
Figure 2017509238
と置く。但し、
Figure 2017509238
であり、かつ
Figure 2017509238
である。
このとき、あるMSE基準下で、2次多項式(等式(2)を参照)用予測器係数は、
Figure 2017509238
によって得られる。
後続区分の工程
ある実施形態では、第g番目(g > 1)の区分につき、区分境界における連続性制限を維持することが望まれ得る。それ故、区分g-1とgとの間の境界点において、予測値
Figure 2017509238
は、
Figure 2017509238
のように決定され得る。再び、training区分内で考慮下にある画素用の境界点α 及びβを、
Figure 2017509238
及び、もしも現在の区分が末尾区分ならば、
Figure 2017509238
さもなくば、
Figure 2017509238
と定義する。
Figure 2017509238
と置く。但し、
Figure 2017509238
かつ
Figure 2017509238
である。このとき、準備予測器係数は、
Figure 2017509238
として得られる。実際の予測器係数は、これまでの節で述べられた等式を用いて、
Figure 2017509238
の様に復元される必要がある。
図3のステップ(310b)に記すように、いくつかの実施形態では、数値上の問題(例えば、多項式係数が、サポートされる数値範囲外の値を取っているかも知れない)のせいで、それらの解は「不適」と考えられるかも知れない。このとき、当該区分について、1次多項式を用い得る。例えば、先頭区分につき、もしも係数が適性制限に違反しているならば、そのとき、1次多項式の係数は、
Figure 2017509238
を用いて、決定され得る。但し、
Figure 2017509238
であり、全ての行列及びベクトル成分は、等式(42)及び(43)のように定義される。同様に、第g番目(g > 1)の区分につき、1次多項式の係数は、
Figure 2017509238
のように導かれ得る。但し、等式(46)及び(47)で定義されるような
Figure 2017509238
を所与のものとして、
Figure 2017509238
である。
Δの選出
ある実施形態では、Δは、区分長に対する小さいパーセンテージ(例えば10%)
として定め得る。ある別の実施形態では、Δは、予測曲線がある基準、例えば、SD
R値の全範囲を通じて非減少であること、を満たすよう、反復過程により決定し得る。例えば、SDR値が増加するにつれて、もしもSDRからEDRへのマッピングがある区分区間で減少するならば、そのときは当該区間につき、Δの値を少しずつ次第に増加させて、ついには、SDRからEDRへのマッピングがSDR値の全範囲を通じて決して減少しないようにすることができるかも知れない。
区分の合併
ある実施形態では、ある条件の下に、2隣接区分は、単一の区分へと合併され得る。例えば、ある区分内で利用可能な画素数がある閾値よりも少ないならば、その区分は、次の区分と合併され得る。それでもなお閾値に満たない場合は、合併区分内の画素総数が閾値を越えるまで、この手続きを継続し得る。末尾区分については、もしも閾値よりも少ない画素数しか持たないならば、末尾から2番目の区分と合併され得る。
偏った画素分布を有する区分
コンテンツによっては、特定の区分群が偏った画素分布を有し得ることが知られている。例えば、SDR範囲のある区分群において、観察可能なほとんどの画素が、区分群のある終端の方に向かって偏っているかも知れない。ある実施形態では、高度に偏った画素分布を有するそのような区分群につき、予測器係数は、ヒストグラムに基づく重みではなく、むしろ「均等荷重」コスト関数を用いて、生成され得る。
再び、区分g (g > 1)を考える。等式(45)に記述の
Figure 2017509238
を所与のものとして、今、その成分を
Figure 2017509238
及び
Figure 2017509238
と定義する。
等式(46)と比較すると、等式(54)内では、
Figure 2017509238
の成分について、ヒストグラム係数hbによる荷重は、もはや為されていない。よって、全ての
Figure 2017509238
値は、均等に荷重されている。同様に、等式(47)と比較すると、等式(55)内では、
Figure 2017509238
の成分について、
Figure 2017509238
値はhbで正規化されており、このため、今やhb値で正規化されたwb 値が生み出される。零除算を避けるため、hb= 0について、零のヒストグラム値は近隣の非零画素数からの補間を受け得る。等式(54)及び(55)を所与のものとすると、予測器係数は、以前と同様に、等式(48)及び(49)を用いて生成される。
コンピュータシステム実装例
本発明の実施形態は、コンピュータシステム、電子回路およびコンポーネントで構成されたシステム、マイクロコントローラ、フィールドプログラマブルゲートアレイ(FPGA)または他のコンフィギュラブルまたはプログラマブルロジックデバイス(PLD)、離散時間またはデジタル信号プロセッサ(DSP)、特定用途向けIC(ASIC)などの集積回路(IC)デバイス、および/または、このようなシステム、デバイスまたはコンポーネントを1つ以上含む装置、を用いて実施し得る。このコンピュータおよび/またはICは、本明細書に記載の区分的階層間予測に関する命令を実施し、制御し、または実行し得る。コンピュータおよび/またはICは、本明細書に記載の区分的階層間予測に関係する様々なパラメータや値の内のいずれを演算してもよい。符号化及び復号化の実施形態は、ハードウェア、ソフトウェア、ファームウェア、および、その様々な組み合わせで実施され得る。
本発明の特定の態様は、本発明の方法をプロセッサに行わせるためのソフトウェア命令を実行するコンピュータプロセッサを含む。例えば、ディスプレイ、エンコーダ、セットトップボックス、トランスコーダなどの中の1つ以上のプロセッサは、そのプロセッサがアクセス可能なプログラムメモリ内にあるソフトウェア命令を実行することによって、上記のような区分的な階層間予測に関する方法を実施し得る。本発明は、プログラム製品形態で提供されてもよい。このプログラム製品は、データプロセッサによって実行された時に本発明の方法をデータプロセッサに実行させるための命令を含む1セットのコンピュータ可読信号を格納する任意の媒体を含み得る。本発明によるプログラム製品は、様々な形態をとり得る。例えば、このプログラム製品は、フロッピーディスケット、ハードディスクドライブを含む磁気データ記憶媒体、CD ROM、DVDを含む光学データ記憶媒体、ROM、フラッシュRAMなどを含む電子データ記憶媒体、などの物理的媒体を含み得る。このプログラム製品上のコンピュータ可読信号は、任意に、圧縮または暗号化されていてもよい。
上記においてあるコンポーネント(例えば、ソフトウェアモジュール、プロセッサ、アセンブリ、デバイス、回路など)に言及している場合、そのコンポーネントへの言及(「手段」への言及を含む)は、別途示唆のない限り、当該コンポーネントの機能を果たす(例えば、機能的に均等である)あらゆるコンポーネント(上記した本発明の実施形態例に出てくる機能を果たす開示された構造に対して構造的に均等ではないコンポーネントも含む)を、当該コンポーネントの均等物として、含むものと解釈されるべきである。
均等物、拡張物、代替物、その他
区分的階層間予測に関する実施形態例を上述した。この明細書中において、態様毎に異なり得る多数の詳細事項に言及しながら本発明の実施形態を説明した。従って、本発明が何たるか、また、本出願人が本発明であると意図するものを示す唯一且つ排他的な指標は、本願が特許になった際の請求の範囲(今後出されるあらゆる訂正を含む、特許となった特定請求項)である。当該請求項に含まれる用語に対して本明細書中に明示したあらゆる定義が、請求項内で使用される当該用語の意味を決定するものとする。よって、請求項において明示されていない限定事項、要素、性質、特徴、利点または属性は、その請求項の範囲をいかなる意味においても限定すべきではない。従って、本明細書および図面は、限定的ではなく、例示的であるとみなされるものである。

Claims (22)

  1. 区分的階層間予測器を生成するための方法であって、以下を含む方法:
    第1のダイナミックレンジを備える第1の映像信号(124)にアクセスする工程と、
    前記第1の映像信号を第2のダイナミックレンジ内で表現する第2の映像信号(126)にアクセスする工程であって、前記第2のダイナミックレンジは前記第1のダイナミックレンジよりも低い工程と、
    前記第1の映像信号の画素を前記第2の映像信号の画素に応答して予測する区分的予測器を、プロセッサを用いて生成する工程であって、前記区分的予測器を生成することは以下を含む工程:
    前記第2の映像信号に所属するあるフレーム内に収められた1組の画素値についての1つ以上の正の整数乗項を含む、第1組の予計算値を生成する工程(202、302)と、
    前記第2の映像信号に所属するあるフレームにつき、
    前記プロセッサを使用し、これにより
    前記第2の映像信号に所属の前記フレームに関するヒストグラムを生成する工程(206、306)と、
    前記第2の映像信号に所属の前記フレームに関して生成された前記ヒストグラムに基づく、また、前記第1の映像信号内の対応フレームが有する画素値についての1つ以上の関数による出力値を含む、第2組の予計算値を生成する工程(206、306)と、
    前記第1組及び第2組の予計算値と前記ヒストグラムとを使用し、前記区分的予測器内の少なくとも1つの多項式についてその係数を生成する工程(210、310)。
  2. 前記第1のダイナミックレンジは高またはエンハンストダイナミックレンジであり、前記第2のダイナミックレンジはスタンダードダイナミックレンジであり、かつ、前記第2の映像信号はビット深度Mを有する、請求項1に記載の方法。
  3. 前記第1組の予計算値を生成する工程は(sj)nの計算を含み、その中で、nは0より大きい整数であり、sjは範囲[0, K-1]内に納まる画素値を表し、但しK = 2Mである、請求項2に記載の方法。
  4. 前記ビット深度Mは8または10ビットである、請求項2に記載の方法。
  5. 前記第1組の予計算値を生成する工程は
    Figure 2017509238
    の計算を含み、その中で、bは範囲[0, K-1]内に納まる画素値を表し、nは1以上の整数であり、K = 2Mである、請求項2に記載の方法。
  6. 前記第2組の予計算値の生成は
    Figure 2017509238
    の計算を含み、但し、bは範囲[0, K-1]に納まる画素値を表し、K = 2Mであり、Pはフレームj内で考慮下の総画素数を表し、sjiはフレームj内で前記第2の映像信号が有する画素値を表し、vjiは前記第1の映像信号内で対応するj番目のフレームに属する画素値を表す、請求項2に記載の方法。
  7. 前記区分的予測器を生成する工程は、前記予測器の出力ピボット点を算出する工程をさらに含み、その中で前記ピボット点は入力範囲を前記予測器が備える第1及び第2の多項式間で分割し、前記出力ピボット点を算出する工程は以下を含む、請求項1に記載の方法:
    可能なピボット点の範囲内に納まる2つ以上のピボット点候補につき、
    前記第1組及び前記第2組の予計算値を使用して前記第1及び第2の多項式の係数を算出する工程と、
    前記の算出された係数に基づき、予測コスト関数用歪みメトリックを算出する工程(212)と、
    その後さらに、前記出力ピボット点として、前記2つ以上のピボット点候補の内、その点について前記算出された歪みメトリックが最小であるピボット点を選出する工程(216)。
  8. 前記算出される歪みメトリックは、前記予測器多項式を使用して生成される予測値と、前記第1の映像信号が有する対応画素値との間の平均2乗誤差に基づく、請求項7に記載の方法。
  9. 前記算出される歪みメトリックは、前記多項式予測器を使用して生成される最大及び最小予測誤差間の差異最小化に基づく、請求項7に記載の方法。
  10. 前記区分的予測器は2つ、4つ、6つ、または8つの2次多項式を含む、請求項1に記載の方法。
  11. 前記第1及び前記第2組の予計算値を使用して前記第1及び第2多項式の係数を算出する工程は、前記ピボット点候補における前記第1及び第2多項式間の連続性制限を考慮に入れる、請求項7に記載の方法。
  12. 前記歪みメトリックを算出する工程は、前記算出されたヒストグラムと前記第2組の予計算値とに基づく、請求項7に記載の方法。
  13. 前記歪みメトリックを算出する工程は
    Figure 2017509238
    の算出を含み、その中で、sjvは前記ピボット点候補を表し、wbは前記第2組の予計算値内のある値を表し、hbは値bを備える画素についてのヒストグラム値を表し、
    Figure 2017509238
    は予測値を表す、請求項7に記載の方法。
  14. 可能ピボット点の前記範囲は範囲[0, K-1]であって、その中で、K = 2Mであり、Mは前記第2の映像信号が備えるビット深度を表す、請求項7に記載の方法。
  15. 可能ピボット点の前記範囲は範囲[search_low, search_high]であって、但し所与の閾値deltaにつき、
    Figure 2017509238
    であり、但し、
    Figure 2017509238
    はある先行フレームについての出力ピボット点を表し、K = 2Mであり、Mは前記第2の映像信号が備えるビット深度を表す、請求項7に記載の方法。
  16. 現行フレーム用に前記ヒストグラム及び前記第2組の予計算値内の値を生成する工程は、前記現行フレームに先行する1つ以上のフレーム用のヒストグラム値及び予計算値を考慮に入れる、請求項1に記載の方法。
  17. P、すなわち、フレームj内で考慮下にある総画素数は、前記フレームj内にある実際の画素数よりも少ない、請求項5に記載の方法。
  18. 前記第1組及び前記第2組の予計算値は1つ以上のルックアップテーブルに記憶される、請求項1に記載の方法。
  19. 前記区分的予測器を生成する工程は以下をさらに含む、請求項1に記載の方法:
    前記第2のダイナミックレンジを1組の区分に分割する工程であって、2番目の区分と末尾から2番目の区分との間の各区分が等長となるような工程。
  20. 前記1組の区分の内少なくとも1つの区分について、
    training区分を決定する工程であって、前記training区分は前記の少なくとも1つの区分とその隣接区分の一部とを含む工程と、
    前記training区分内の画素を用いて前記の少なくとも1つの区分につき多項式予測器係数を生成する工程と、
    をさらに含む、請求項19に記載の方法。
  21. プロセッサを含み、請求項1に規定された方法を実行するように構成された装置。
  22. 請求項1に記載の方法を実行するためのコンピュータ実行可能命令を格納した非一時的なコンピュータ可読記憶媒体コンピュータコンピュータ。
JP2016551759A 2014-02-13 2015-02-04 エンハンストダイナミックレンジを備える信号のための区分的階層間予測 Active JP6253794B2 (ja)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201461939614P 2014-02-13 2014-02-13
US61/939,614 2014-02-13
US201462013611P 2014-06-18 2014-06-18
US62/013,611 2014-06-18
PCT/US2015/014482 WO2015123067A1 (en) 2014-02-13 2015-02-04 Piecewise inter-layer prediction for signals with enhanced dynamic range

Publications (2)

Publication Number Publication Date
JP2017509238A true JP2017509238A (ja) 2017-03-30
JP6253794B2 JP6253794B2 (ja) 2017-12-27

Family

ID=52577967

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016551759A Active JP6253794B2 (ja) 2014-02-13 2015-02-04 エンハンストダイナミックレンジを備える信号のための区分的階層間予測

Country Status (5)

Country Link
US (1) US10123019B2 (ja)
EP (1) EP3105926B1 (ja)
JP (1) JP6253794B2 (ja)
CN (1) CN105993175B (ja)
WO (1) WO2015123067A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2020524446A (ja) * 2017-06-16 2020-08-13 ドルビー ラボラトリーズ ライセンシング コーポレイション 効率的なエンド・ツー・エンドシングルレイヤー逆ディスプレイマネジメント符号化

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2661309C1 (ru) 2015-02-17 2018-07-13 Долби Лэборетериз Лайсенсинг Корпорейшн Межслойное предсказание для сигналов с улучшенным динамическим диапазоном
CN107750456B (zh) * 2015-04-13 2022-02-11 V-诺瓦国际有限公司 利用依赖于复杂性信息的一个信号的数据速率目标对多个信号进行编码
US10467735B2 (en) 2015-08-25 2019-11-05 Interdigital Vc Holdings, Inc. Inverse tone mapping based on luminance zones
JP6803378B2 (ja) 2015-08-31 2020-12-23 インターデジタル ヴイシー ホールディングス, インコーポレイテッド 逆トーンマッピングの方法及び装置
US10652588B2 (en) 2015-09-21 2020-05-12 Vid Scale, Inc. Inverse reshaping for high dynamic range video coding
US10499084B2 (en) 2015-11-02 2019-12-03 Dolby Laboratories Licensing Corporation Piecewise-linear inter-layer predictor for high-dynamic range video coding
US10904534B2 (en) 2016-04-19 2021-01-26 Dolby Laboratories Licensing Corporation Enhancement layer masking for high-dynamic range video coding
EP3319013A1 (en) * 2016-11-03 2018-05-09 Thomson Licensing Method and device for estimating cast shadow regions and/or highlight regions in images
JP6684971B2 (ja) 2017-01-18 2020-04-22 ドルビー ラボラトリーズ ライセンシング コーポレイション ハイダイナミックレンジ映像を符号化するためのセグメントベース再構成
WO2020125804A1 (en) 2018-12-21 2020-06-25 Beijing Bytedance Network Technology Co., Ltd. Inter prediction using polynomial model
CN114830640A (zh) * 2019-12-06 2022-07-29 杜比实验室特许公司 级联预测

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012520619A (ja) * 2009-03-13 2012-09-06 ドルビー ラボラトリーズ ライセンシング コーポレイション 高ダイナミックレンジ、視覚ダイナミックレンジ及び広色域のビデオの階層化圧縮
WO2012142471A1 (en) * 2011-04-14 2012-10-18 Dolby Laboratories Licensing Corporation Multiple color channel multiple regression predictor
WO2013112532A2 (en) * 2012-01-24 2013-08-01 Dolby Laboratories Licensing Corporation Piecewise cross color channel predictor

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008043198A1 (en) * 2006-09-30 2008-04-17 Thomson Licensing Method and device for encoding and decoding color enhancement layer for video
WO2008049446A1 (en) * 2006-10-25 2008-05-02 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Quality scalable coding
CN102007768B (zh) 2008-04-16 2013-05-29 弗朗霍夫应用科学研究促进协会 编码器、解码器、编码方法及解码方法
TWI479898B (zh) 2010-08-25 2015-04-01 Dolby Lab Licensing Corp 擴展影像動態範圍
EP2702764B1 (en) * 2011-04-25 2016-08-31 Dolby Laboratories Licensing Corporation Non-linear vdr residual quantizer
TWI556629B (zh) 2012-01-03 2016-11-01 杜比實驗室特許公司 規定視覺動態範圍編碼操作及參數
WO2013106190A1 (en) 2012-01-09 2013-07-18 Dolby Laboratories Licensing Corporation Hybrid reference picture reconstruction method for single and multiple layered video coding systems
ES2702614T3 (es) 2013-01-02 2019-03-04 Dolby Laboratories Licensing Corp Codificación retrocompatible para señales de vídeo de ultra alta definición con dominio dinámico aumentado
US9948916B2 (en) * 2013-10-14 2018-04-17 Qualcomm Incorporated Three-dimensional lookup table based color gamut scalability in multi-layer video coding

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012520619A (ja) * 2009-03-13 2012-09-06 ドルビー ラボラトリーズ ライセンシング コーポレイション 高ダイナミックレンジ、視覚ダイナミックレンジ及び広色域のビデオの階層化圧縮
WO2012142471A1 (en) * 2011-04-14 2012-10-18 Dolby Laboratories Licensing Corporation Multiple color channel multiple regression predictor
WO2013112532A2 (en) * 2012-01-24 2013-08-01 Dolby Laboratories Licensing Corporation Piecewise cross color channel predictor

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2020524446A (ja) * 2017-06-16 2020-08-13 ドルビー ラボラトリーズ ライセンシング コーポレイション 効率的なエンド・ツー・エンドシングルレイヤー逆ディスプレイマネジメント符号化
JP7037584B2 (ja) 2017-06-16 2022-03-16 ドルビー ラボラトリーズ ライセンシング コーポレイション 効率的なエンド・ツー・エンドシングルレイヤー逆ディスプレイマネジメント符号化
US11288781B2 (en) 2017-06-16 2022-03-29 Dolby Laboratories Licensing Corporation Efficient end-to-end single layer inverse display management coding

Also Published As

Publication number Publication date
EP3105926B1 (en) 2018-04-11
US20170180734A1 (en) 2017-06-22
WO2015123067A1 (en) 2015-08-20
JP6253794B2 (ja) 2017-12-27
CN105993175A (zh) 2016-10-05
EP3105926A1 (en) 2016-12-21
CN105993175B (zh) 2019-01-18
US10123019B2 (en) 2018-11-06

Similar Documents

Publication Publication Date Title
JP6253794B2 (ja) エンハンストダイナミックレンジを備える信号のための区分的階層間予測
JP6312775B2 (ja) エンハンストダイナミックレンジ信号の階層符号化のための適応的再構成
CN109068139B (zh) 用于环内再成形的方法、设备和计算机可读存储介质
CN107409213B (zh) 用于高动态范围图像的内容自适应感知量化器
RU2610589C2 (ru) Высокоточная повышающая дискретизация при масштабируемом кодировании видеоизображений с высокой битовой глубиной
JP6320644B2 (ja) エンハンストダイナミックレンジを備える信号のための階層間予測
TW202029774A (zh) 藉由轉換域濾波之量化假影抑制及信號恢復
JP7309081B2 (ja) Hdrイメージングにおけるブラインド局所再整形
EP3387833B1 (en) Low-complexity lookup table construction for hdr coding with reduced interpolation error
US10715772B2 (en) High dynamic range color conversion correction

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20170821

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20170829

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20171016

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20171031

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20171128

R150 Certificate of patent or registration of utility model

Ref document number: 6253794

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250