JP2017534194A - 知覚的量子化されたビデオコンテンツの符号化および復号化 - Google Patents

知覚的量子化されたビデオコンテンツの符号化および復号化 Download PDF

Info

Publication number
JP2017534194A
JP2017534194A JP2017516393A JP2017516393A JP2017534194A JP 2017534194 A JP2017534194 A JP 2017534194A JP 2017516393 A JP2017516393 A JP 2017516393A JP 2017516393 A JP2017516393 A JP 2017516393A JP 2017534194 A JP2017534194 A JP 2017534194A
Authority
JP
Japan
Prior art keywords
video signal
color space
color
generate
applying
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2017516393A
Other languages
English (en)
Other versions
JP6302600B2 (ja
Inventor
フレーリヒ,ジャン
アトキンス,ロビン
ワン,キュウイ
スゥ,グワン‐ミーン
イン,ペン
Original Assignee
ドルビー ラボラトリーズ ライセンシング コーポレイション
ドルビー ラボラトリーズ ライセンシング コーポレイション
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ドルビー ラボラトリーズ ライセンシング コーポレイション, ドルビー ラボラトリーズ ライセンシング コーポレイション filed Critical ドルビー ラボラトリーズ ライセンシング コーポレイション
Publication of JP2017534194A publication Critical patent/JP2017534194A/ja
Application granted granted Critical
Publication of JP6302600B2 publication Critical patent/JP6302600B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/186Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a colour or a chrominance component
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/85Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N9/00Details of colour television systems
    • H04N9/64Circuits for processing colour signals
    • H04N9/67Circuits for processing colour signals for matrixing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N9/00Details of colour television systems
    • H04N9/64Circuits for processing colour signals
    • H04N9/68Circuits for processing colour signals for controlling the amplitude of colour signals, e.g. automatic chroma control circuits

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Processing Of Color Television Signals (AREA)
  • Image Processing (AREA)
  • Color Television Systems (AREA)

Abstract

従来のガンマ符号化ビデオと比べると、知覚的量子化ビデオによって、ハイダイナミックレンジビデオの送信およびディスプレイマネジメントをより柔軟におこなえるが、既存の標準的コーデックを用いての圧縮は同様に効率的にはならない。RGB/XYZからLMSへの変換後に色クロストーク変換を適用することによる、知覚的符号化ビデオの符号化効率を改善するための技術を記載する。このような変換によって、色の見えモデルにおけるルマとクロマとの間の相関性は増大するものの、広色域のHDR信号についての知覚的均質性および総合的な符号化効率が向上する。

Description

関連出願への相互参照
本願は、2014年9月26日付け出願の米国仮特許出願第62/056,093号に基づく優先権を主張するものであり、この出願の開示内容を全て本願に援用する。
本発明は、広く画像に関する。より詳細には、本発明のある実施形態は、知覚的量子化された(perceptually−quantized)ビデオについての符号化、復号化、およびディスプレイマネジメントに関する。
ビデオ信号は、ビット深度、色空間、色域、および解像度などの複数のパラメータによって特徴付けることができる。ビデオ信号が有する特徴のひとつの重要な側面は、そのダイナミックレンジである。ダイナミックレンジ(DR)とは、画像における強度(例えば、輝度、ルマ)の範囲(例えば最暗部から最明部まで)である。本明細書で用いるとき、「ダイナミックレンジ」(DR)という用語は、画像においてある範囲(例えば最暗部から最明部まで)の強度(例えば、輝度、ルマ)を知覚する人間の心理視覚システム(HVS)の能力に関し得る。この意味で、DRは、「シーン−リファード」(scene−referred)の強度に関する。DRはまた、ディスプレイデバイスがある特定の幅の強度範囲を妥当にまたは近似的に描画する能力にも関し得る。この意味で、DRは、「ディスプレイ−リファード」(display−referred)の強度に関する。本明細書中の任意の箇所において、ある特定の意味が特に重要であると明示的に指定しない限り、この用語をどちらの意味でも(例えば区別なく)用い得ると理解されたい。
本明細書で用いるとき、ハイダイナミックレンジ(HDR)という用語は、人間の視覚システム(HVS)が有するおよそ14〜15桁にわたるDR幅(例えば、1:10,000)に関する。実際には、画像は1つ以上の色成分(例えば、輝度Yならびに色差CbとCr)を含んでおり、各色成分は、nビット/ピクセルの精度(例えば、n=8)で表現される。例えば、線形または古典的ガンマ方式の輝度符号化(例えば、ITU Rec.709による)を用いると、n≦8の画像(例えば、カラー24ビットJPEG画像)で1:100から1:1000ぐらいまでのダイナミックレンジならば標準ダイナミックレンジの画像と考えられる一方で、n>8の画像でより高いダイナミックレンジならばハイダイナミックレンジの画像と考えてよい。また、低ビット深度で非線形の輝度符号化(例えば、10ビット対数輝度符号化)や、あるいはIndustrial Light and Magic社が開発したOpenEXRファイルフォーマットのような高精度(例えば16ビット)の浮動小数点フォーマットを用いても、HDR画像を格納および配信し得る。
HDR画像を、そのダイナミックレンジを完全にはサポートしないエンコーダを用いて符号化および送信しなければならないことがある。例えば、ビデオコーデックが8ビットまたは10ビットのビデオデータしかサポートしていない可能性があるが、これはHDRビデオのための典型的なビット深度である12〜16ビットよりもはるかに低いビット深度である。本願にその開示内容が全て援用されるSMPTE Standard ST 2084(2014)「Perceptually−based EOTF」に記載のような、HDRビデオに知覚的量子化を使用した前処理または後処理をおこなうことにより、ビット深度要件を低減し得る。しかし、これは符号化効率に影響を及ぼし得る。というのは、典型的には、符号化規格は、ガンマ符号化されたYCbCrビデオ信号に向けて最適化されているからである。本願の発明者らの理解によれば、知覚的量子化されたビデオを符号化および復号化するための改善技術が望まれる。
本節に記載されている手法は、探求し得る手法ではあるが、必ずしもこれまでに着想または探求されてきた手法ではない。従って、別途示唆のない限り、本節に記載された手法のいずれも、本節に記載されているという理由だけで従来技術としての適格性を有すると考えるべきではない。同様に、別途示唆のない限り、1以上の手法に関して特定される問題が、本節に基づいて、いずれかの先行技術において認識されたことがあると考えるべきではない。
本発明の一実施形態を、限定のためではなく例示を目的として、添付図面の各図により示す。これらの図において、類似の要素には同種の参照符号を付している。
図1Aは、知覚的量子化されていない色空間においてHDRビデオを符号化および復号化するための処理パイプラインの一態様例を示す。 図1Bは、本発明の実施形態による、知覚的量子化された色空間においてHDRビデオを符号化および復号化するための処理パイプラインの態様例を示す。 図1Cは、本発明の実施形態による、知覚的量子化された色空間においてHDRビデオを符号化および復号化するための処理パイプラインの態様例を示す。 図1Dは、本発明の実施形態による、知覚的量子化された色空間においてHDRビデオを符号化および復号化するための処理パイプラインの態様例を示す。 図2Aは、ガンマ符号化またはPQ符号化されたRGB信号を、IPT−PQ色空間へと変換するためのデータフロー例を示す。 図2Bは、本発明のある実施形態による、ガンマ符号化またはPQ符号化されたRGB信号を、変形IPT−PQ色空間へと変換するためのデータフロー例を示す。 図2Cは、本発明のある実施形態による、IPT−PQ信号を、ガンマ符号化またはPQ符号化されたRGB信号へと変換するためのデータフロー例を示す。
知覚的量子化されたビデオ信号のための、符号化および復号化技術を本明細書に記載する。
以下の説明においては、便宜上、本発明を完全に理解できるように、多数の詳細事項を説明する。ただし、これらの詳細事項抜きでも本発明を実施可能であることは明白であろう。他方、本発明の説明を不必要に不明瞭にしないように、周知の構造およびデバイスの細かな詳細までは説明しない。
概要
本明細書に記載の実施形態例は、知覚的量子化されたビデオ信号のための符号化および復号化技術に関する。第1の色空間(例えば、RGB−PQまたはRGBガンマ)において、第1のHDRビデオ信号にアクセスする。第1のビデオ信号に1つ以上の色変換を適用して、知覚的量子化された反対色空間(opponent color space)(例えば、IPT−PQ)において出力ビデオ信号を生成する。出力ビデオ信号をビデオエンコーダで圧縮して、符号化ビットストリームを生成する。第1のビデオ信号に1つ以上の色変換を適用して出力ビデオ信号を生成することはさらに、第1のビデオ信号に第1の色変換を適用して、線形原色空間(primary color space)(例えば線形LMS)において第2のビデオ信号を生成することと、第2のビデオ信号に色クロストーク変換行列(C)を適用して、線形原色空間において第3のビデオ信号を生成することと、第3のビデオ信号に知覚的量子化器を適用して、知覚的量子化された原色空間(例えば、LMS−PQ)において第4のビデオ信号を生成することと、第4のビデオ信号に第2の色変換を適用して、知覚的量子化された反対色空間(例えば、IPT−PQc)において出力ビデオ信号を生成すること、を含む。
ある別の実施形態では、デコーダにおいて、符号化ビットストリームを復号化することにより、知覚的量子化された反対色空間(例えば、IPT−PQ)において第1のHDR信号を生成する。第1のHDR信号に1つ以上の色変換を適用して、第1の線形原色空間(例えば、線形LMS)において第2のビデオ信号を生成する。次に、第2のビデオ信号に色クロストーク変換行列の逆行列を適用して、線形原色空間において第3のビデオ信号を生成する。そして最後に、第3のビデオ信号に第2組の色変換を適用して、所望の色空間(例えば、RGB−ガンマまたはRGB−PQ)において第4のビデオ信号を生成する。
ある実施形態において、ビデオ符号化および復号化は、ビデオ復号化に続いて実行されるディスプレイマネジメントと同じ知覚的量子化色空間(例えば、IPT−PQ)で実行される。このような実施形態において、デコーダにおける演算処理数を低減するために、逆方向再構成およびトーンマッピングに関するルックアップテーブルを結合してもよい。
ある実施形態において、知覚的量子化された色空間で符号化および復号化をおこなう際、符号化の前に、ルマおよびクロマチャネル間のダイナミックレンジ比を維持するように、ルマ成分を非線形関数で再構成しそしてクロマ成分を線形のクロマ再構成関数で再構成してもよい。これらの再構成関数はデコーダにおいて逆転され、それから任意のディスプレイマネジメント処理を適用する。
HDR信号の符号化および復号化
図1Aは、HDRビデオ信号を符号化および復号化するパイプラインの一態様例を示す。入力(102)は、HDRカメラによって撮影されたHDRビデオ信号であってもよいし、ビデオ編集、カラーグレーディングなど、さまざまな画像およびビデオ処理工程を含むビデオ後処理プロセスの出力を表していてもよい。また、ビデオエンコーダ(110)で圧縮を受ける前に、ビデオ信号(102)を色変換ユニット(105)で処理することにより、ビデオエンコーダ(110)入力における色形式を、エンコーダの最適化されている、サポートされた色形式に整合させることも可能である。例えば、もし入力(102)がRGB4:4:4色形式であり、かつビデオエンコーダ(110)がYCbCr4:2:0形式で演算処理をおこなうならば、ユニット(105)は、RGBからYCbCrへの色変換およびカラーサブサンプリングを実行し得る。
ビデオエンコーダ(110)は、MPEG−2、MPEG−4(part 4)、H.264、H.265(HEVC)、VP8などの当該分野で知られたビデオ圧縮方式のいずれかを用いた、シングルレイヤエンコーダまたはマルチレイヤエンコーダであり得る。ビデオエンコーダ(110)の出力は、記憶媒体(例えば、ハードドライブまたは光学的媒体)に格納してもよいし、あるいは下流側へ送信し、セットトップボックス、メディアプレイヤなどの受信デバイスにおいて復号化してもよい。受信器において、ビデオデコーダ(115)が、ビデオエンコーダ(110)により実行された工程を逆転させ、ターゲットディスプレイ(135)上に表示すべき解凍ビデオ信号(117)を生成する。ディスプレイ(135)は、ビデオ信号(102)を生成するために使用したリファレンスディスプレイの特性と一致していてもよいし、そうでなくともよい。例えば、ビデオ信号(102)は2,000ニトのディスプレイを使用してカラーグレーディングされるかもしれず、その一方でターゲットディスプレイ(135)は1,000ニト以下であるかもしれない。ターゲットディスプレイ(135)の特性に整合させるために、いくつかの実施形態では、受信器(または当該ディスプレイ自身)において、色変換およびトーンマッピングなどのさまざまなビデオ信号処理工程を実行し得る。これらの処理工程は、一般に「ディスプレイマネジメント」と呼ばれる。ディスプレイマネジメント処理の例が、2014年2月13日付け出願のPCT出願シリアル番号第PCT/US2014/016304号(以下、「‘304出願」と呼ぶ)および2014年7月3日付け出願の米国仮特許出願シリアル番号第62/020,622号(以下、「‘622出願」と呼ぶ)(米国特許出願シリアル番号第14/755,755号としても出願済み)に記載されており、両出願の開示内容を全て本願に援用する。
図1Aに示すように、また‘304出願に記載のように、いくつかの実施形態において、HDRビデオ信号のディスプレイマネジメント処理(例えば、工程125および130)は、IPT−PQなどの知覚的補正または知覚的量子化された色空間を使用しておこなえば、恩恵を受けられる。本願にその全文が援用される、F.EbnerおよびM.D.Fairchildによる「Development and testing of a color space (ipt) with improved hue uniformity」、Proc.6th Color Imaging Conference: Color Science, Systems, and Applications, IS&T, Scottsdale, Arizona、1998年11月、8〜13ページ(以下、「Ebner論文」と呼ぶ)に記載のIPT色空間は、人間の視覚システムにおける錐体間の色差のモデルである。その意味ではYCbCrまたはCIE−Lab色空間のようであるが、いくつかの科学的研究において、これらの空間よりも人間の視覚処理をより良く模擬することが分かっている。CIE−Labと同様に、IPTは、何らかの参照輝度に対する正規化された空間である。ある実施形態において、正規化は、ターゲットディスプレイの最大輝度に基づく。
YCbCr、YUV、IPT、Labなどの色空間は、ルマ成分(例えば、YまたはI)ならびに2つのクロマまたはクロマ差成分(例えば、CbCrまたはPT)を用いて信号を表現するため、一般に反対色空間と呼ばれる。これに対し、RGB、LMS、XYZなどの色空間は、一般に原色空間と呼ばれる。画像およびビデオを圧縮する際、原色空間よりも、反対色空間において演算処理をおこなうほうが好ましい。というのも、反対色空間においては、色成分のあいだの相関性がより少なく、何らの知覚的損失も被ることなくクロマ成分を圧縮の前にサブサンプリングできるため、総合的な圧縮率が向上し得るからである。
本明細書において、用語「PQ」は知覚的量子化を指す。人間の視覚システムは、光レベルの増大に対して非常に非線形的に反応する。人間が刺激を視る能力は、その刺激の輝度、その刺激の大きさ、その刺激を構成する空間周波数、および、その刺激を見ている瞬間までに目が適応した輝度レベルに影響される。好適な実施形態において、知覚的量子化器関数は、線形入力グレイレベルを、人間の視覚システムにおけるコントラスト感度閾値によりマッチした出力グレイレベルにマッピングする。PQマッピング関数の一例は、SMPTE ST 2084:2014 specificationに、および、J.S.Millerらによる2012年12月06日出願の「Perceptual luminance nonlinearity−based image data exchange across different display capabilities」という表題のPCT出願シリアル番号第PCT/US2012/068212号(以下、「‘212出願」と呼ぶ)に記載されており、この出願の開示内容を全て本願に援用する。ある固定刺激サイズに対し、それぞれの輝度レベル(即ち、刺激レベル)について、最高感度の適応レベルおよび最高感度の空間周波数(HVSモデルによる)に応じて、その輝度レベルにおける最小可視コントラストステップを選択する。物理的な陰極線管(CRT)装置の応答曲線を表しており、人間の視覚システムの応答の仕方に対して非常に大まかな意味での類似性を偶然有し得る従来のガンマ曲線と比較すると、‘212出願において決定されているPQ曲線は、比較的シンプルな関数モデルを用いながら人間の視覚システムの真の視覚応答を模擬している。本明細書において、RGB−PQ、IPT−PQ、YCbCr−PQなどの用語は、知覚的量子化関数を使用して少なくとも1つのカラーチャネルが再マッピングまたは量子化されている色空間を指す。
表1は、表示時点においてデジタルビデオ符号値を絶対線形輝度レベルに変換するための知覚的曲線電気−光学伝達関数(EOTF)の計算を示している。絶対線形輝度をデジタル符号値に変換するための逆関数OETFの計算も含まれている。
Figure 2017534194
備考:
1.演算子INTは、0〜0.4999...の範囲の小数部に対しては値0を返し、0.5〜0.9999...の範囲の小数部に対しては+1を返す(即ち、0.5以上の小数部は切り上げ)。
2.丸めの問題を回避するために、定数は全て12ビット有理数の正確な倍数として定義する。
3.R、GまたはB信号成分は、上記のY信号成分と同じ方法で算出する。
図1Aに示すように、知覚的補正または知覚的量子化された色空間(IPT−PQなど)で演算処理するためには、クロマアップサンプリングおよび第1の線形色変換(例えば、YCbCr4:2:0からRGB4:4:4への)や、それに続く第2の非線形色変換(例えば、RGBからIPT−PQへの)などの、いくつかの処理工程(120)が必要となり得る。一例として、図2Aおよびこれに対応する本明細書の後述部分が、RGBからIPT−PQへの色変換のための処理パイプラインをさらに詳細に示す。
IPT−PQ空間において演算処理をおこなえばトーンマッピング(125)および色域調節(130)演算処理の出力が向上し得る一方で、そのような色空間へ入力信号(117)を変換するために必要な色変換(120)は、携帯型計算タブレットまたはスマートフォンなどの、いくつかのデバイスの能力を超えているかも知れない。ゆえに、いくつかの実施形態において、演算処理のいくつかをエンコーダへと移すことによって、デコーダの複雑性を低減することが望ましい。例えば、ある実施形態において、色変換(120)をデコーダから低減または完全に除去できるように、知覚的に補正された色空間(例えば、IPT−PQ)で符号化処理の全体を実行するのが望ましいであろう。残念ながら既存のビデオ符号化方式は、典型的にはYCbCr色空間に符号化された、ガンマ符号化標準ダイナミックレンジビデオ信号のために最適化されている。本発明者らの理解によれば、既存のビデオコーデックを知覚的補正色空間のHDR信号に使用するためには、本明細書に記載のような、いくつかの追加的な工程が必要となる。
順方向および逆方向の信号再構成
図1Bは、知覚的補正色空間(例えば、IPT−PQ)に符号化されたHDRビデオの符号化および復号化についての一実施形態例を表す。ある実施形態において、入力(102)は、知覚的符号化された色空間(例えば、RGB−PQ)に既にあってもよい。色変換工程(105)は、入力信号(102)の色空間を入力色空間(例えば、RGB−PQ4:4:4)から、ビデオエンコーダ(110)を使用しての符号化に適した知覚的補正色形式(例えば、IPT−PQ4:2:0)へと変換する。既存のビデオ圧縮方式を利用するために、符号化(110)の前に、ある実施形態では、知覚的符号化された入力を順方向の再構成処理(107)によって再構成する。順方向再構成処理の一例が、2014年3月25日付け出願の「Encoding perceptually−quantized video content in multi−layer VDR coding」という表題のPCT出願第PCT/US2014/031716号(以下、「‘716出願」と呼ぶ)に記載されており、この出願の開示内容を全て本願に援用する。再構成関数は、ルマチャネルのみに適用されてもよく、または全チャネルに適用されてもよい。いくつかの実施形態において、ルマおよびクロマチャネルには異なる再構成関数を使用してもよい。
‘716出願に記載のように、PQ符号化された信号について、ある実施形態においては、信号再構成関数(107)は、
Figure 2017534194
と表し得る。但し、vLおよびvHは、入力HDR信号(102)の注目しているカラーチャネルにおける最小値および最大値を表し、cLおよびcHは、対応する最小および最大出力値を表し、viはi番目の入力画素を表し、siは対応する出力を表す。例えば、ある実施形態において、(0,1)内の正規化された色値に対し、シングルレイヤシステムでは、cL=0かつcH=1である。αの値は一定であるが、フレーム毎、シーン毎、その他の適切な基準に従って、適応および変更してもよい。ある実施形態において、再構成関数に対する入力がPQ符号化されているならば、α>1であり、あるいはガンマ符号化されているならば、α<1である。
デコーダにおいて、ある実施形態では、逆構成すなわち逆方向再構成の演算処理(122)は、
Figure 2017534194
と表し得る。但し、復号化された入力画素^付siにつき、^付viは対応する出力を表す。実際には、ルックアップテーブル(LUT)を用いて、順方向および逆方向の再構成演算処理をおこなってもよい。
復号化信号(117)は知覚的符号化された色空間に既にあるものとすると、ディスプレイマネジメント演算処理(例えば、125および130)に要求されるのは、はるかに簡素なクロマアップサンプリング(例えば、4:2:0から4:4:4への)だけである。いくつかの実施形態において、クロマアップサンプリング演算処理を、逆方向再構成演算処理(122)の前にビデオデコーダ(115)の一部としておこなってもよい。ビデオデコーダはこのような演算処理をハードウェアで直接にサポートし得るからである。
図1Cは、逆方向再構成演算処理とトーンマッピング演算処理とを結合して単一ユニット(122B)(典型的には一組のLUT)にすることによる、図1Bに示したシステム(100B)の改変を表している。先に説明したように、ビデオ符号化(110)およびビデオ復号化(115)を実行するにあたって、シングルレイヤ符号化システム(例えば、ビデオエンコーダ(110)として、単一の10ビットH.264またはH.265ビデオエンコーダを利用し得る)もしくはデュアルレイヤ符号化システム(例えば、ビデオエンコーダ(110)として、2014年7月16日付け出願のPCT出願シリアル番号第PCT/US2014/042583号に記載のある、2つ以上の8ビットH.264またはH.265ビデオエンコーダを適用し得る。この出願の開示内容を全て本願に援用する)のいずれかを使用し得る。トーンマッピングは各カラーチャネル毎に独立しておこなうものとすれば、2関数を、以下のように統合することができる。
あるシングルレイヤのコーデックについて、
y=S(x) (3)
は、復号化信号xに対して再構成関数の出力yを生成するルックアップテーブルを表すものとする。また、
z=T(y) (4)
は、入力yに対してトーンマッピング関数の出力zを生成するルックアップテーブルを表すものとする。すると、これら2つのLUTを、
z=T(S(x))=K(x) (5)
として併合できる。例えば、10ビットの入力xに対し、K(x)は1024個のエントリを有し得る。
ある1つのデュアルレイヤコーデックは、典型的には1つの8ビットベースレイヤ(BL)および1つの8ビットエンハンスメントレイヤ(EL)を有し、それぞれが各自の再構成ユニットを備える。SB(xB)およびSE(xE)は、最終HDR信号を生成するために使用される、ベースおよびエンハンスメントレイヤの逆方向再構成関数を表すものとする。仮に、
Y=SB(xB)+SE(xE) (6)
であるものとすると、2DのLUT
U(xB,xE)=T(SB(xB)+SE(xE))) (7)
を使用することにより、これら2つの演算処理を結合できる。8ビット入力データおよび10ビット出力データに対し、このようなLUTは各カラーチャネル毎に、約256*256*2=131キロバイトを必要とし得る。
受信器において利用可能なハードウェアアクセラレータがあればそれを利用するために、クロマアップサンプリングモジュール(124)をビデオデコーダ(115)の演算処理と統合してもよいことに留意されたい。
いくつかの実施形態において、符号化、復号化、およびディスプレイマネジメントは全てひとつの知覚的色空間(例えば、IPT−PQ)で実行されるが、複数のこのような色空間を用いてもよい。例えば、符号化および復号化を反対色空間(例えば、IPT−PQまたはYCbCr−PQ)でおこないつつも、ディスプレイマネジメントを原色空間(例えば、RGB−PQ)でおこなってよい。このような一態様例を、符号化および復号化をIPT−PQ色空間でおこないつつもディスプレイマネジメントをLMS−PQ色空間でおこなう別の実施形態として、図1Dに示す。LMS−PQ空間におけるディスプレイマネジメント処理の一例が、‘622出願に記載されている。‘622出願に記載のように、また図2Aに部分的に示すように、ビデオデータをLMS−PQ色空間へと変換することは、以下の工程を含み得る。
a)必要ならば(不図示)、クロマアップサンプリングやその他の色変換(例えば、IPT−PQからRGBへの)をおこない、復号化信号をガンマ符号化RGBまたはRGB−PQ符号化信号(205)へと変換すること。
b)RGB信号を線形化すること(工程210)。復号化HDR信号(123)はガンマ符号化またはPQ符号化されている可能性があり、そのいずれであるかは、符号化ビットストリームに埋め込まれるEOTFフィールドなどのメタデータを用いて典型的には示され(signaled)、ソースディスプレイによる符号値から輝度への変換を逆転あるいは解除するためにこれが用いられる。例えば、入力信号がガンマ符号化されているならば、本工程は逆ガンマ関数を適用する。もしも入力信号が“212PCT出願に従ってPQ符号化されているのならば、本工程は逆PQ関数を適用する。実際には、3つの予め算出された1−Dルックアップテーブル(LUT)を用いて、この線形化工程を実行し得る。
c)線形RGBからLMSへの変換をおこなうこと(工程215および220)。本工程において、工程b)の出力信号(212)を、LMS色空間へと変換する。典型的には、入力メタデータで制御された3×3行列を適用することによって、本工程をおこなう。
d)PQ符号化(230)をL、M、およびS色成分のそれぞれに適用して、LMS−PQ色空間において出力(232)を生成すること。本工程もまた、3つの1−DのLUTを用いておこなえる。いくつかの実施形態において、完全な色変換パイプライン(例えば、IPT−PQからLMS−PQへの)を、1つの3DのLUTを使用して算出し得る。もしもディスプレイマネジメントをLMS−PQではなくIPT−PQ空間でおこなうのならば、追加的なLMSからIPTへの色変換(235)をLMS−PQ信号(232)に適用して、IPT−PQ信号(237)を生成する。
いくつかの実施形態において、LMS−PQ空間でディスプレイマネジメントをおこなうほうが演算的負荷がより少ない。しかし、LMS−PQ色空間におけるカラーチャネル間の相関性は高いので、この空間でビデオエンコーダ(110)およびデコーダ(115)に演算処理させるのは効率的ではない。よって、エンコーダ−デコーダの対は、ある他の色空間(典型的には、YCbCrまたはIPTなどの反対色空間)において演算処理をおこなう必要がある。
いくつかの実施形態において、ビデオエンコーダ(110)およびデコーダ(115)への総合的なビット深度要件を低減するために、知覚的反対色空間(YCbCr−PQまたはIPT−PQなどの)を用いてHDRビデオ信号を符号化するほうが好ましいことがある。次節において、IPT−PQ色空間に符号化する際に符号化効率を改善する方法を記載する。
向上した知覚的均質性
色彩科学(color science)において、また、本明細書で用いるとき、「色の見えモデル(color appearance model)」という用語は、「少なくとも明度、彩度、および色相という相対的な色の見え属性についての予測因子を含んだ、任意のモデル」(M.D.Fairchild, “Color Appearance Models,” Second Edition, John Wiley and Sons, 2005)を指す。このようなモデルの例には、CIE L*a*b*(CIELAB)、IPT、およびCIECAM02が含まれる。図2Aに示すように、また、より詳細に後程説明するように、あるRGB信号を与えられると、これを上記のような色空間へと、以下のような工程を用いて変換できる。
a)CIE XYXその他任意のRGB符号化を、LMS錐体基本空間に近い線形三刺激値空間へと変換する(工程215、220)
b)場合によっては色適応変換を、典型的には線形スケーリングを介して適用する(不図示)
c)PQ符号化(230)などの非線形変換を適用する
d)いくつかの追加的な処理(例えば、235)を適用して、カラーチャネル間の相関性をさらに低減する。
このアプローチにより、ITU Rec.709など、広くない色域の色空間については、良好な知覚的均質性および色相線形性が結果として得られる。しかし、HDRイメージングに典型的に使用されるRec.2020などの広い色域の色については、色の見えを正確に予測できない。CIECAM02が有する数値的問題を乗り越えるための数々の提言が現存するが、これらの提言によっても、「あるRGBチャネルの低振幅の色寄与における色差を、他のカラーチャネルの高振幅の色刺激が存在する場合に誇張しすぎる」という問題は解決されない。よって、本発明者の知る限り、広い色刺激に対する正確な色の見えモデルは存在しない。ある実施形態において、XYZからLMSへの工程の後で、新たな色クロストーク変換工程によって、色の見えモデルにおける飽和色の知覚的均質性、色相線形性、および符号化効率が大きく向上する。このような向上した色モデルを、画像やビデオの符号化ならびにディスプレイマネジメントの両方において使用できる。一例として、次節において、IPT−PQ色空間についてクロストーク変換行列を導出するが、同様なアプローチを、他の色の見えモデルに適用することが可能である。
IPT−PQ色空間における知覚的均質性および符号語使用率の改善
前述のように、また図2Aに示すように、RGBからIPT−PQへの色変換は、以下の工程を用いておこなうことができる。
a)入力信号(102)の画素値(例えば、0から4095まで)を正規化し、0および1間のダイナミックレンジを有する画素値にすること。
b)(工程210)EOTF(入力メタデータが提供し得る)を用いて、入力信号を線形化すること。例えば、入力信号(205)がガンマ符号化されているならば、本工程は逆ガンマ関数を適用する。もしも入力信号が“212PCT出願に従ってPQ符号化されているならば、本工程は逆PQ関数を適用する。
c)(工程215および220)工程b)の出力(例えば、信号212)をLMS色空間へと変換すること。本工程は、典型的には、RGBからXYZへの変換(工程215)を含み、その後にXYZからLMSへの変換(工程220)が続く。
d)Ebner論文によると、従来のLMSからIPTへの色空間変換は、LMSデータに対し先ず非線形べき関数を適用することと、その後に線形変換行列を適用することとを含む。データをLMSからIPTへと変換し、その後にPQ関数を適用してIPT−PQ領域に置いてもよいのだが、ある好適な実施形態では、本工程(230)において、LMSからIPTへの非線形符号化用の従来のべき関数を、PQ非線形符号化で代替する。例えば、非線形のL、M、およびS値は、等式(t2)におけるV信号と同様に算出される。但し、Y信号は、線形のL、M、またはS成分値で置き換える。いくつかの実施形態において、PQ符号化の正規化バージョンを用いてもよく、このとき等式(t3)の工程を省略でき、出力PQ値の範囲は0と1の間である。
e)標準的なLMSからIPTへの線形変換を用いて、本工程(235)が、工程d)の出力(例えば、信号232)に対するIPT−PQ色空間への変換を完成する。
簡単のために、任意の色空間は、[0 1]の値域内に正規化された3−Dキューブ上で定義されているものとする。但し、1はある所定のビット深度に対する最大可能画素値を表す。符号化効率を改善するために、ある好適な実施形態において、知覚的符号化された色空間への各変換の後で、別の色変換を適用してクロマ成分を適切にずらすことができる。
PQ符号化RGB値(205)からIPT−PQ色空間へのマッピングについて考える。このマッピングは高度に非線形であって、RGB−PQキューブをキューブではない形状へと変換する。一例として、図3Aは、約10,000個のRGB−PQ点をIPT−PQ空間へとマッピングした後の、P対Tの相関関係を表している。もとのRGB−PQキューブは、もはやキューブではないことが見て取れる。IPT−PQ空間には、2つの尾がある。すなわち、領域P[−0.3,−0.1]×T[−0.4,−0.2](305)における1つの短い尾と、領域P[0.1,0.2]×T[0.6,1](310)におけるもう1つの長い尾である。尾の周囲に未使用のまま残された空っぽの空間のせいで、IPT−PQ空間の長い尾は、符号語の非効率な割り当てを招く。これらの尾はまた、知覚的な重要性を有していないようである。
さて、図2Bに表わされた、RGBからIPT−PQへの色変換パイプラインについて考える。図2Bに示すように、線形LMSデータ(222)に対し、非線形PQ符号化(230)を適用する前に、チャネルクロストークを調節する追加的な工程(225)を適用する。いま、限定することなく、
Figure 2017534194
は、入力LMSデータから変換LMS(LMSc)データへのカラーチャネルクロストーク調節(225)の一例を表すものとする。但し、Cは3×3の色クロストーク変換行列を表しており、cは3色成分間のクロストークレベルを制御する定数(例えば、c=0.02またはc=0.04)である。いくつかの実施形態において、複数の変数パラメータによって、Cを定義し得る。いくつかの実施形態において、クロストーク変換を追加しても色処理パイプラインにさらなる演算が追加されることのないように、RGBからLMSへの工程(215、220)と、LMSからLMScへの工程(225)とを結合し、単一の工程にしてもよい。
IPT−PQcは、色クロストーク変換(225)を適用したときの変換後の色空間を指すものとすると、図3Bは、約10,000個のRGB−PQ点をIPT−PQc空間へとマッピングした後の、P対Tの相関関係を表している。図3Bに示されるように、IPT−PQc色空間によって、符号語使用率を改善することができ、従ってより効率的に圧縮をおこなうことが可能となる。いくつかの実施形態において、等式(8)のパラメータcをフレーム毎、シーン毎に調節することにより、符号語使用率を最適に調節できる。その後、符号化ビットストリームにおけるメタデータの一部として、この値をデコーダへと送信できる。
図2Cは、信号(238)を、IPT−PQまたはIPT−PQc色空間からRGBガンマ符号化またはRGB−PQ符号化色空間の信号(205)へと変換するための、色処理パイプラインを表す。もしも入力(237)がIPT−PQ色空間に符号化されている(すなわち、クロマクロストーク調節されていない)ならば、等式(8)の逆色クロストーク(例えば、C-1)を適用する工程(250)を削除できる。残りの工程は、以下を含む。
a)(工程240)IPT−PQ入力(238)に逆IPT変換を適用して、PQ符号化LMSデータ(242)を生成すること。
b)(工程245)PQ符号化LMSデータ(242)からPQ符号化を除去して、線形LMSデータ(247)を生成すること。
c)符号化(例えば、225)中に適用された色クロストークを逆転させる、オプションとしておこなわれ得る工程(250)の後で、線形LMSデータ(252)または(247)を線形RGBデータ(262)へと変換すること(工程255および260)。
d)(工程265)必要に応じて、線形RGB信号(262)をガンマ符号化RGBデータまたはPQ符号化RGBデータのいずれかへと変換すること。
先と同様に、逆クロストーク行列を適用すること(250)は、LMSからRGBへの色変換工程(255、260)と結合してもよい。
色クロストーク変換行列の決定
等式(8)から、色クロストーク変換行列を、変数cによって完全に決定できる。cを増加すれば、P/Tの符号語効率が増加するが、IとP/T成分との間の相関性が増加するので、総合的な圧縮効率は減少する。ある所定のc値に対し、Pmax(c)およびPmin(c)はPチャネルにおける最大値および最小値を表し、Tmax(c)およびTmin(c)はTチャネルにおける最大値および最小値を表すものとする。ある実施形態において、クロマ(P/T)の定義域を、AR(c)=M(c)×N(c)個の領域(regions)に細分できる。但し、各領域はD×D(例えば、D=0.01)であり、
Figure 2017534194
である。
UR(c)は、AR(c)域における符号語使用率を表すものとする。ある実施形態において、表2は、UR(c)を決定する方法についての一例を疑似コードで示している。
Figure 2017534194
本明細書で用いるとき、「1組の可能なRGB(x,y)値」という用語は、限定することなく、出力IPT−PQc値を導出するために使用される可能な入力RGB値の1集合または1部分集合を指しており、例えば入力ビデオの1フレームまたは1シーンで検出される値たち、あるいは可能なRGB空間全体などのことである。一般に、このようなサンプルの数が多いほうが、クロストーク変換行列について、より正確な見積もりを得るために役立つ。
いま、
Figure 2017534194
は、正規化された符号語使用率を表すものとすると、図4は、cに対するE(c)値のプロット例を表している。図4に示すように、約c=0.02のところに「ニー」ポイント(“knee” point)(410)がある。実験結果によって、ある実施形態において、このニーポイントは符号語使用率と圧縮効率とのあいだの非常に良い妥協点であることが実証された。ゆえに、ある実施形態において、c値は、E(c)データ曲線の1階導関数に最大値を与える値として選択できる。要約すれば、cを導出することは以下の工程を含み得る。
a)各cに対し、ある範囲のRGB値について、対応するIPT−PQc値を算出すること。このRGB値の範囲は、全ての可能なRGB値を含んでいてもよいし、あるフレームまたはフレーム群内に実測されたRGB値の範囲だけを含んでいてもよい。
b)IPT−PQc空間における有効なクロマ符号語の数を確認すること。例えばP/T空間をM(c)*N(c)の格子に分割し、この格子において有効符号語を数えることによる。
d)経験的または客観的な基準を用いて、最良のcを決定すること。例えば、一実施形態において、さまざまなc値を用いてフレームシーケンスを圧縮し、最良の圧縮率を与える値を最良のcだとして選択できる。あるいは、ある実施形態において、cに対する有効符号語についての関数(例えば、UR(c)またはE(c))を所与のものとすると、このような関数の1階導関数(例えば、
Figure 2017534194
)に最大値を与える値として、最良のcを決定できる。
いくつかの実施形態において、別のカラーチャネルマッピングを用いて、符号語効率および色クロストーク行列を決定し得る。輝度(I)のみまたはルマ対クロマ(例えば、I対PまたはI対T)などのマッピングを用いてもよいし、あるいは、ルマおよびクロマの完全な3D体積表現を用いることさえ可能である。
クロマ再構成
ビデオデータがIPT−PQまたはIPT−PQc色空間にあるならば、PおよびTカラーチャネルは多くのエネルギーを含むことが観察された。圧縮ビットストリームのビットレートが制限されているとすれば、これらのチャネルを直接に符号化することは、かえって非効率であり得る。というのは、これらのチャネルにどのようにビットを割り当てても、その分だけ、Iチャネルに対するビット割り当てが低下するからである。ある実施形態において、簡素な線形量子化器を適用して、総合的な画質に影響することなく、PおよびTチャネルのダイナミックレンジを低減できる。例えば、
Figure 2017534194
は、Pチャネル用の量子化器関数を表す。但し、ある所定のビット深度BL(例えば、BL=10ビット)に対し、midはある中域の値(例えば、mid=2BL-1)を表し、maxは最大可能値(例えば、max=2BL−1)を表し、
Figure 2017534194
はPチャネルへのある入力画素値を表し、
Figure 2017534194
は量子化値を表し、wpは典型的には1より小さい(例えば、wp=0.8)ある重み定数を表し、
Figure 2017534194
は、IおよびPチャネルにおいて予測(または実測)される入力値下限および上限であり、
Figure 2017534194
は量子化Iチャネル値の限界(例えば、
Figure 2017534194
)である。実質上、等式(11)は、ルマ(I)およびクロマ(P/T)間のダイナミックレンジ比を維持するように、P/Tチャネルを量子化する。
Tチャネルについてもまた、同様な量子化器を使用し得る。等式(11)における量子化パラメータが所与ならば、エンコーダにおけるPおよびT成分の量子化を、デコーダにより逆転できる。ある実施形態において、IPT−PQcデータに対し、P/Tデータの典型的な範囲は[−0.25 0.3]以内に収まる。出力範囲は、[−0.5 0.5]以内に収まるように選択される。
コンピュータシステム実装例
本発明の実施形態は、コンピュータシステム、電子回路およびコンポーネントで構成されたシステム、マイクロコントローラ、フィールドプログラマブルゲートアレイ(FPGA)または他のコンフィギュラブルまたはプログラマブルロジックデバイス(PLD)、離散時間またはデジタル信号プロセッサ(DSP)、特定用途向けIC(ASIC)などの集積回路(IC)デバイス、および/または、このようなシステム、デバイスまたはコンポーネントを1つ以上含む装置、を用いて実施し得る。このコンピュータおよび/またはICは、本明細書に記載の知覚的量子化HDRビデオの符号化および復号化に関する命令を実施し、制御し、または実行し得る。コンピュータおよび/またはICは、本明細書に記載の知覚的量子化HDRビデオの符号化および復号化プロセスに関係する様々なパラメータや値の内のいずれを演算してもよい。画像およびビデオ実施形態は、ハードウェア、ソフトウェア、ファームウェア、および、その様々な組み合わせで実施され得る。
本発明の特定の態様は、本発明の方法をプロセッサに行わせるためのソフトウェア命令を実行するコンピュータプロセッサを含む。例えば、ディスプレイ、エンコーダ、セットトップボックス、トランスコーダなどの中の1つ以上のプロセッサは、そのプロセッサがアクセス可能なプログラムメモリ内にあるソフトウェア命令を実行することによって、上記のような知覚的量子化HDRビデオの符号化および復号化に関する方法を実施し得る。本発明は、プログラム製品形態で提供されてもよい。このプログラム製品は、データプロセッサによって実行された時に本発明の方法をデータプロセッサに実行させるための命令を含む1セットのコンピュータ可読信号を格納する任意の非一時的媒体を含み得る。本発明によるプログラム製品は、様々な形態をとり得る。例えば、このプログラム製品は、フロッピーディスケット、ハードディスクドライブを含む磁気データ記憶媒体、CD ROM、DVDを含む光学データ記憶媒体、ROM、フラッシュRAMなどを含む電子データ記憶媒体、などの物理的媒体を含み得る。このプログラム製品上のコンピュータ可読信号は、任意に、圧縮または暗号化されていてもよい。
上記においてあるコンポーネント(例えば、ソフトウェアモジュール、プロセッサ、アセンブリ、デバイス、回路など)に言及している場合、そのコンポーネントへの言及(「手段」への言及を含む)は、別途示唆のない限り、当該コンポーネントの機能を果たす(例えば、機能的に均等である)あらゆるコンポーネント(上記した本発明の実施形態例に出てくる機能を果たす開示された構造に対して構造的に均等ではないコンポーネントも含む)を、当該コンポーネントの均等物として、含むものと解釈されるべきである。
均等物、拡張物、代替物、その他
知覚的量子化HDRビデオの符号化および復号化に関する実施形態例を上述した。この明細書中において、態様毎に異なり得る多数の詳細事項に言及しながら本発明の実施形態を説明した。従って、本発明が何たるか、また、本出願人が本発明であると意図するものを示す唯一且つ排他的な指標は、本願が特許になった際の請求の範囲(今後出されるあらゆる訂正を含む、特許となった特定請求項)である。当該請求項に含まれる用語に対して本明細書中に明示したあらゆる定義が、請求項内で使用される当該用語の意味を決定するものとする。よって、請求項において明示されていない限定事項、要素、性質、特徴、利点または属性は、その請求項の範囲をいかなる意味においても限定すべきではない。従って、本明細書および図面は、限定的ではなく、例示的であるとみなされるものである。
本発明の一実施形態を、限定のためではなく例示を目的として、添付図面の各図により示す。これらの図において、類似の要素には同種の参照符号を付している。
図1Aは、知覚的量子化されていない色空間においてHDRビデオを符号化および復号化するための処理パイプラインの一態様例を示す。 図1Bは、本発明の実施形態による、知覚的量子化された色空間においてHDRビデオを符号化および復号化するための処理パイプラインの態様例を示す。 図1Cは、本発明の実施形態による、知覚的量子化された色空間においてHDRビデオを符号化および復号化するための処理パイプラインの態様例を示す。 図1Dは、本発明の実施形態による、知覚的量子化された色空間においてHDRビデオを符号化および復号化するための処理パイプラインの態様例を示す。 図2Aは、ガンマ符号化またはPQ符号化されたRGB信号を、IPT−PQ色空間へと変換するためのデータフロー例を示す。 図2Bは、本発明のある実施形態による、ガンマ符号化またはPQ符号化されたRGB信号を、変形IPT−PQ色空間へと変換するためのデータフロー例を示す。 図2Cは、本発明のある実施形態による、IPT−PQ信号を、ガンマ符号化またはPQ符号化されたRGB信号へと変換するためのデータフロー例を示す。 図3Aは、約10,000個のRGB−PQ点をIPT−PQ空間へとマッピ ングした後の、P対Tの相関関係を示す。 図3Bは、約10,000個のRGB−PQ点をIPT−PQc空間へとマッ ピングした後の、P対Tの相関関係を示す。 図4は、cに対するE(c)値のプロット例を示す。

Claims (22)

  1. ハイダイナミックレンジ(HDR)ビデオについて符号化効率および知覚的均質性を改善するための方法であって、
    第1の色空間において第1のビデオ信号(102)にアクセスする工程と、
    前記第1のビデオ信号に1つ以上の色変換を適用して、知覚的量子化反対色空間において出力ビデオ信号を生成する工程と、
    を包含し、
    前記第1のビデオ信号に1つ以上の色変換を適用して前記出力ビデオ信号を生成する工程はさらに、
    前記第1のビデオ信号に第1の色変換を適用して、線形原色空間において第2のビデオ信号(222)を生成する工程と、
    前記第2のビデオ信号に色クロストーク変換行列を適用して、前記線形原色空間において第3のビデオ信号(227)を生成する工程と、
    前記第3のビデオ信号(227)に知覚的量子化器を適用して、知覚的量子化原色空間において第4のビデオ信号(232)を生成する工程と、
    前記第4のビデオ信号(232)に第2の色変換を適用して、前記知覚的量子化反対色空間において前記出力ビデオ信号を生成する工程と、
    を含む、方法。
  2. 前記第1の色空間は、ガンマ符号化RGB(RGBガンマ)または知覚的量子化RGB(RGB−PQ)である、請求項1に記載の方法。
  3. さらに、
    前記第1のビデオ信号に線形化関数を適用して、線形化された第1のビデオ信号を生成する工程と、
    前記線形化された第1のビデオ信号に前記第1の色変換を適用する工程と、
    を包含する請求項1に記載の方法。
  4. 前記知覚的量子化色空間は、SMPTE specification ST 1084に従って生成される、請求項1に記載の方法。
  5. 前記線形原色空間はLMS色空間である、請求項1に記載の方法。
  6. 6.前記知覚的量子化反対色空間は、知覚的量子化IPT色空間(IPT−PQ)である、請求項1に記載の方法。
  7. 前記色クロストーク変換行列は
    Figure 2017534194
    を含み、ここでcは定数である、請求項1に記載の方法。
  8. cの値は、前記知覚的量子化反対色空間のクロマ成分における有効符号語の量の関数として決定される、請求項7に記載の方法。
  9. cの値はE(c)の1階導関数に最大値を与える値として決定され、ここでE(c)は、cの関数であって前記知覚的量子化反対色空間のクロマ成分における有効符号語についての関数を表している、請求項8に記載の方法。
  10. 前記知覚的量子化反対色空間はIPT−PQ色空間を含み、ここでPおよびTはクロマ成分である、請求項9に記載の方法。
  11. 前記出力ビデオ信号に再構成関数を適用して再構成出力関数を生成する工程と、前記再構成出力関数をビデオエンコーダで圧縮して符号化ビットストリームを生成する工程と、をさらに包含する請求項1に記載の方法。
  12. 前記再構成関数は、前記出力ビデオ信号のルマ成分については非線形であって、かつ前記出力ビデオ信号の1つ以上のクロマ成分については線形である、請求項11に記載の方法。
  13. 前記出力ビデオ信号のクロマチャネル(P)についての前記再構成関数は、
    Figure 2017534194
    によって与えられる入力−出力関数を含み、ここで、midおよびmaxは前記再構成関数への入力における中域の値および最大値を表し、
    Figure 2017534194
    は前記再構成関数への入力画素値を表し、
    Figure 2017534194
    は対応する出力値を表し、wpは重み定数であり、
    Figure 2017534194
    はルマ(I)およびクロマ(P)チャネルについての前記出力ビデオ信号の下限および上限であり、
    Figure 2017534194
    は前記再構成出力関数のルマチャネル値についての下限および上限である、請求項12に記載の方法。
  14. 前記出力ビデオ信号をビデオエンコーダで圧縮して符号化ビットストリームを生成する工程をさらに包含する、請求項1に記載の方法。
  15. デコーダにおいて解凍HDRビデオ信号を生成する方法であって、
    符号化ビットストリームをデコーダ(115)で復号化して、知覚的量子化反対色空間において第1のHDR信号(117)を生成する工程と、
    前記第1のHDR信号に第1組の1つ以上の色変換を適用して、第1の線形原色空間において第2のビデオ信号(247)を生成する工程と、
    前記第2のビデオ信号に色クロストーク変換行列の逆行列を適用して、前記線形原色空間において第3のビデオ信号を生成する工程と、
    前記第3のビデオ信号に第2組の1つ以上の色変換を適用して、第2の線形原色空間において第4のビデオ信号を生成する工程と、
    を包含する方法。
  16. 前記知覚的量子化反対色空間はIPT−PQ色空間を含む、請求項15に記載の方法。
  17. 前記第1の線形原色空間は線形LMS色空間を含み、かつ前記第2の線形原色空間は線形RGB色空間を含む、請求項15に記載の方法。
  18. 前記色クロストーク変換行列の逆行列は、
    Figure 2017534194
    の逆行列を含み、ここでcは定数である、請求項15に記載の方法。
  19. cの値はエンコーダから前記デコーダへと送信される、請求項18に記載の方法。
  20. 前記第1のHDR信号に逆方向再構成関数を適用して、再構成された第1のHDR信号を生成する工程と、前記再構成された第1のHDR信号に前記第1組の1つ以上の色変換を適用して、前記第2のビデオ信号を生成する工程と、をさらに包含する請求項15に記載の方法。
  21. プロセッサを備えており、かつ、請求項1〜20のいずれかに記載の方法を実行するように構成された装置。
  22. 請求項1〜20のいずれかに記載の方法をプロセッサで実行するためのコンピュータ実行可能命令を格納した、非一時的なコンピュータ可読記憶媒体。
JP2017516393A 2014-09-26 2015-09-24 知覚的量子化されたビデオコンテンツの符号化および復号化 Active JP6302600B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201462056093P 2014-09-26 2014-09-26
US62/056,093 2014-09-26
PCT/US2015/051964 WO2016049327A1 (en) 2014-09-26 2015-09-24 Encoding and decoding perceptually-quantized video content

Publications (2)

Publication Number Publication Date
JP2017534194A true JP2017534194A (ja) 2017-11-16
JP6302600B2 JP6302600B2 (ja) 2018-03-28

Family

ID=54330856

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017516393A Active JP6302600B2 (ja) 2014-09-26 2015-09-24 知覚的量子化されたビデオコンテンツの符号化および復号化

Country Status (7)

Country Link
US (1) US9936199B2 (ja)
EP (1) EP3198556B1 (ja)
JP (1) JP6302600B2 (ja)
KR (1) KR101794817B1 (ja)
CN (1) CN107079137B (ja)
RU (1) RU2648634C1 (ja)
WO (1) WO2016049327A1 (ja)

Families Citing this family (39)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
BR112017018893B1 (pt) 2015-03-02 2023-05-09 Dolby International Ab Método, aparelho e mídia de armazenamento não transitório legível por computador para a quantização perceptiva de imagens com um processador, e sistema para quantização adaptativa
WO2016153896A1 (en) 2015-03-20 2016-09-29 Dolby Laboratories Licensing Corporation Signal reshaping approximation
US10484684B2 (en) 2015-04-22 2019-11-19 Dolby Laboratories Licensing Corporation Signal reshaping and coding in the IPT-PQ color space
EP4020995A1 (en) 2015-07-16 2022-06-29 Dolby Laboratories Licensing Corporation Signal reshaping and coding for hdr and wide color gamut signals
US10575005B2 (en) * 2015-07-22 2020-02-25 Dolby Laboratories Licensing Corporation Video coding and delivery with both spatial and dynamic range scalability
WO2017019818A1 (en) * 2015-07-28 2017-02-02 Vid Scale, Inc. High dynamic range video coding architectures with multiple operating modes
JP6320440B2 (ja) 2015-08-04 2018-05-09 ドルビー ラボラトリーズ ライセンシング コーポレイション ハイダイナミックレンジ信号のための信号再構成
US10200690B2 (en) * 2015-09-22 2019-02-05 Qualcomm Incorporated Video decoder conformance for high dynamic range (HDR) video coding using a core video standard
EP3151562B1 (en) * 2015-09-29 2020-06-17 Dolby Laboratories Licensing Corporation Feature based bitrate allocation in non-backward compatible multi-layer codec via machine learning
US10311558B2 (en) 2015-11-16 2019-06-04 Dolby Laboratories Licensing Corporation Efficient image processing on content-adaptive PQ signal domain
CN108885783B (zh) 2016-03-23 2022-02-15 杜比实验室特许公司 编码和解码可逆制作质量单层视频信号
US10397586B2 (en) 2016-03-30 2019-08-27 Dolby Laboratories Licensing Corporation Chroma reshaping
US10979601B2 (en) 2016-04-04 2021-04-13 Dolby Laboratories Licensing Corporation High precision gamut mapping
WO2017176594A1 (en) * 2016-04-04 2017-10-12 Dolby International Ab High precision gamut mapping
US10218952B2 (en) 2016-11-28 2019-02-26 Microsoft Technology Licensing, Llc Architecture for rendering high dynamic range video on enhanced dynamic range display devices
CN106851272B (zh) * 2017-01-20 2019-11-12 杭州当虹科技股份有限公司 一种hdr和sdr自适应码率控制的方法
US10176561B2 (en) 2017-01-27 2019-01-08 Microsoft Technology Licensing, Llc Content-adaptive adjustments to tone mapping operations for high dynamic range content
US10104334B2 (en) 2017-01-27 2018-10-16 Microsoft Technology Licensing, Llc Content-adaptive adjustment of display device brightness levels when rendering high dynamic range content
CN110447051B (zh) 2017-03-20 2023-10-31 杜比实验室特许公司 在感知上保持参考场景的对比度和色度
US11288781B2 (en) 2017-06-16 2022-03-29 Dolby Laboratories Licensing Corporation Efficient end-to-end single layer inverse display management coding
CN107197235B (zh) * 2017-06-26 2018-10-12 杭州当虹科技股份有限公司 一种hdr视频预处理方法
CN110301134B (zh) 2017-06-29 2024-02-06 杜比实验室特许公司 整合的图像整形和视频编码
EP3659339B1 (en) 2017-07-24 2021-09-01 Dolby Laboratories Licensing Corporation Single-channel inverse mapping for image/video processing
KR102413839B1 (ko) 2017-11-15 2022-06-28 삼성전자 주식회사 컨텐츠 제공장치, 그 제어방법 및 기록매체
JP6952202B2 (ja) 2018-02-28 2021-10-20 ドルビー ラボラトリーズ ライセンシング コーポレイション 画像/映像処理のためのリニアエンコーダ
CN110855912B (zh) * 2018-08-21 2024-08-27 辉达公司 抑制hdr视频系统中的像素着色误差
US10757428B2 (en) 2018-10-10 2020-08-25 Apple Inc. Luma and chroma reshaping of HDR video encoding
US10957024B2 (en) 2018-10-30 2021-03-23 Microsoft Technology Licensing, Llc Real time tone mapping of high dynamic range image data at time of playback on a lower dynamic range display
US11503310B2 (en) * 2018-10-31 2022-11-15 Ati Technologies Ulc Method and apparatus for an HDR hardware processor inline to hardware encoder and decoder
US11275568B2 (en) 2019-01-14 2022-03-15 Microsoft Technology Licensing, Llc Generating a synchronous digital circuit from a source code construct defining a function call
US11113176B2 (en) 2019-01-14 2021-09-07 Microsoft Technology Licensing, Llc Generating a debugging network for a synchronous digital circuit during compilation of program source code
US11093682B2 (en) 2019-01-14 2021-08-17 Microsoft Technology Licensing, Llc Language and compiler that generate synchronous digital circuits that maintain thread execution order
US11144286B2 (en) 2019-01-14 2021-10-12 Microsoft Technology Licensing, Llc Generating synchronous digital circuits from source code constructs that map to circuit implementations
US11106437B2 (en) * 2019-01-14 2021-08-31 Microsoft Technology Licensing, Llc Lookup table optimization for programming languages that target synchronous digital circuits
EP4005208A1 (en) * 2019-07-30 2022-06-01 Dolby Laboratories Licensing Corporation Electro-optical transfer function conversion and signal legalization
CN110933416B (zh) * 2019-11-12 2021-07-20 宁波大学 高动态范围视频自适应预处理方法
CN112885300B (zh) * 2019-11-29 2024-04-05 美国像素公司 使用多个非线性模型的面板校准
CN112188179B (zh) * 2020-08-28 2022-07-08 北京小米移动软件有限公司 图像缩略图显示方法、图像缩略图显示装置及存储介质
US11557265B2 (en) 2020-11-13 2023-01-17 Samsung Electronics Co., Ltd. Perceptual color enhancement based on properties of responses of human vision system to color stimulus

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005176361A (ja) * 2003-12-05 2005-06-30 Samsung Electronics Co Ltd 色変換方法および色変換装置
WO2014130343A2 (en) * 2013-02-21 2014-08-28 Dolby Laboratories Licensing Corporation Display management for high dynamic range video

Family Cites Families (44)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100422697B1 (ko) * 1999-12-27 2004-03-12 엘지전자 주식회사 색공간 양자화 묘사자
AU2003205996A1 (en) * 2002-02-28 2003-09-09 Koninklijke Philips Electronics N.V. Method and device for coding and decoding a digital color video sequence
US7142723B2 (en) * 2003-07-18 2006-11-28 Microsoft Corporation System and process for generating high dynamic range images from multiple exposures of a moving scene
EP1538844A3 (en) * 2003-11-26 2006-05-31 Samsung Electronics Co., Ltd. Color image residue transformation and encoding method
KR100601944B1 (ko) 2004-03-08 2006-07-14 삼성전자주식회사 색 변환 방법 및 장치
EP1569458A1 (en) * 2004-02-12 2005-08-31 Matsushita Electric Industrial Co., Ltd. Encoding and decoding of video images based on a non-linear quantization
KR100763178B1 (ko) * 2005-03-04 2007-10-04 삼성전자주식회사 색 공간 스케일러블 비디오 코딩 및 디코딩 방법, 이를위한 장치
JP4822396B2 (ja) * 2005-03-29 2011-11-24 株式会社メガチップス 画像強調装置
US8537893B2 (en) 2006-01-23 2013-09-17 Max-Planck-Gesellschaft Zur Forderung Der Wissenschaften E.V. High dynamic range codecs
EP1933564A1 (en) * 2006-12-14 2008-06-18 Thomson Licensing Method and apparatus for encoding and/or decoding video data using adaptive prediction order for spatial and bit depth prediction
BRPI0720531A2 (pt) * 2006-12-19 2014-01-07 Koninkl Philips Electronics Nv Método e sistema para codificar um sinal de imagem, sinal de imagem, método para decodificar um sinal de imagem, e, decodificador para decodificar um sinal de imagem
US8085852B2 (en) * 2007-06-26 2011-12-27 Mitsubishi Electric Research Laboratories, Inc. Inverse tone mapping for bit-depth scalable image coding
JP5309692B2 (ja) * 2008-05-28 2013-10-09 株式会社Sumco シリコンウェーハの研磨方法
WO2010105036A1 (en) * 2009-03-13 2010-09-16 Dolby Laboratories Licensing Corporation Layered compression of high dynamic range, visual dynamic range, and wide color gamut video
TWI407794B (zh) * 2009-11-17 2013-09-01 Alpha Imaging Technology Corp 檔案壓縮方法及檔案壓縮系統
EP2360926A1 (en) * 2010-01-19 2011-08-24 Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. Image encoder and image decoder
KR101702948B1 (ko) * 2010-07-20 2017-02-06 삼성전자주식회사 깊이영상 부호화를 위한 율-왜곡 최적화 장치 및 방법
TWI559779B (zh) 2010-08-25 2016-11-21 杜比實驗室特許公司 擴展影像動態範圍
ES2750234T3 (es) * 2011-04-14 2020-03-25 Dolby Laboratories Licensing Corp Predictor de regresión múltiple de múltiples canales de color
US9148645B2 (en) * 2011-05-14 2015-09-29 Dolby Laboratories Licensing Corporation Crosstalk cancellation in 3D displays
US9338463B2 (en) * 2011-10-06 2016-05-10 Synopsys, Inc. Visual quality measure for real-time video processing
TWI575933B (zh) 2011-11-04 2017-03-21 杜比實驗室特許公司 階層式視覺動態範圍編碼中之層分解技術
KR102284891B1 (ko) 2011-12-06 2021-08-04 돌비 레버러토리즈 라이쎈싱 코오포레이션 상이한 디스플레이 능력들을 통한 지각적 휘도 비선형성―기반 이미지 데이터 교환을 향상시키는 방법
WO2013106190A1 (en) * 2012-01-09 2013-07-18 Dolby Laboratories Licensing Corporation Hybrid reference picture reconstruction method for single and multiple layered video coding systems
US9129445B2 (en) * 2012-03-14 2015-09-08 Dolby Laboratories Licensing Corporation Efficient tone-mapping of high-bit-depth video to low-bit-depth display
DE112012006541B4 (de) * 2012-07-27 2020-03-19 Hewlett-Packard Development Company, L.P. Verfahren zur Videokompression
CN105787908B (zh) * 2012-08-08 2019-05-14 杜比实验室特许公司 用于高动态范围图像的图像处理方法、装置及存储介质
US20140105278A1 (en) * 2012-10-16 2014-04-17 Microsoft Corporation Color adaptation in video coding
US9445109B2 (en) * 2012-10-16 2016-09-13 Microsoft Technology Licensing, Llc Color adaptation in video coding
EP2750393A1 (en) * 2012-12-26 2014-07-02 Thomson Licensing Method of coding a first and a second version of an image into a base layer and an enhancement layer based on a color gamut mapping model
WO2014160705A1 (en) 2013-03-26 2014-10-02 Dolby Laboratories Licensing Corporation Encoding perceptually-quantized video content in multi-layer vdr coding
US9609336B2 (en) * 2013-04-16 2017-03-28 Fastvdo Llc Adaptive coding, transmission and efficient display of multimedia (acted)
US9584811B2 (en) 2013-06-17 2017-02-28 Dolby Laboratories Licensing Corporation Adaptive reshaping for layered coding of enhanced dynamic range signals
US9628800B2 (en) * 2013-11-18 2017-04-18 Qualcomm Incorporated Adaptive control for transforms in video coding
US10142642B2 (en) * 2014-06-04 2018-11-27 Qualcomm Incorporated Block adaptive color-space conversion coding
US20150373327A1 (en) * 2014-06-20 2015-12-24 Qualcomm Incorporated Block adaptive color-space conversion coding
US9613407B2 (en) 2014-07-03 2017-04-04 Dolby Laboratories Licensing Corporation Display management for high dynamic range video
JP2017531382A (ja) * 2014-09-12 2017-10-19 ヴィド スケール インコーポレイテッド ビデオ符号化のための成分間相関解除
US10057578B2 (en) * 2014-10-07 2018-08-21 Qualcomm Incorporated QP derivation and offset for adaptive color transform in video coding
US10158836B2 (en) * 2015-01-30 2018-12-18 Qualcomm Incorporated Clipping for cross-component prediction and adaptive color transform for video coding
US20160309154A1 (en) * 2015-04-17 2016-10-20 Qualcomm Incorporated Dynamic range adjustment for high dynamic range and wide color gamut video coding
US20160360205A1 (en) * 2015-06-08 2016-12-08 Industrial Technology Research Institute Video encoding methods and systems using adaptive color transform
US10200690B2 (en) * 2015-09-22 2019-02-05 Qualcomm Incorporated Video decoder conformance for high dynamic range (HDR) video coding using a core video standard
US10715816B2 (en) * 2015-11-11 2020-07-14 Apple Inc. Adaptive chroma downsampling and color space conversion techniques

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005176361A (ja) * 2003-12-05 2005-06-30 Samsung Electronics Co Ltd 色変換方法および色変換装置
WO2014130343A2 (en) * 2013-02-21 2014-08-28 Dolby Laboratories Licensing Corporation Display management for high dynamic range video

Also Published As

Publication number Publication date
EP3198556A1 (en) 2017-08-02
US9936199B2 (en) 2018-04-03
CN107079137B (zh) 2019-08-13
KR101794817B1 (ko) 2017-11-07
JP6302600B2 (ja) 2018-03-28
US20170251211A1 (en) 2017-08-31
EP3198556B1 (en) 2018-05-16
KR20170036132A (ko) 2017-03-31
WO2016049327A1 (en) 2016-03-31
CN107079137A (zh) 2017-08-18
RU2648634C1 (ru) 2018-03-26
BR112017005667A2 (pt) 2017-12-12

Similar Documents

Publication Publication Date Title
JP6302600B2 (ja) 知覚的量子化されたビデオコンテンツの符号化および復号化
RU2762384C1 (ru) Переформирование сигналов для сигналов широкого динамического диапазона
JP7541055B2 (ja) 高ダイナミックレンジおよび広色域シーケンスを符号化するシステム
JP6181259B2 (ja) エンハンストダイナミックレンジ信号の階層符号化のための適応的再構成
JP6362793B2 (ja) ハイダイナミックレンジ映像のためのディスプレイマネジメント
KR102531489B1 (ko) 높은 동적 범위 및 넓은 컬러 영역 시퀀스들의 코딩에서의 컬러 볼륨 변환들
JP6608067B2 (ja) 映像復号化器における高ダイナミックレンジ適応演算
JP6395750B2 (ja) ハイダイナミックレンジ信号のための信号再構成
BR112017005667B1 (pt) Método para melhorar a eficiência de codificação e uniformidade perceptual para vídeo de elevada faixa dinâmica (hdr), método para gerar um sinal de vídeo de hdr não comprimido em um decodificador, aparelho e meio de armazenamento que pode ser lido por computador não transitório

Legal Events

Date Code Title Description
A975 Report on accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A971005

Effective date: 20170818

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20171010

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20171219

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20180206

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20180302

R150 Certificate of patent or registration of utility model

Ref document number: 6302600

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250