JP2018511210A - 画素の前処理および符号化 - Google Patents

画素の前処理および符号化 Download PDF

Info

Publication number
JP2018511210A
JP2018511210A JP2017542096A JP2017542096A JP2018511210A JP 2018511210 A JP2018511210 A JP 2018511210A JP 2017542096 A JP2017542096 A JP 2017542096A JP 2017542096 A JP2017542096 A JP 2017542096A JP 2018511210 A JP2018511210 A JP 2018511210A
Authority
JP
Japan
Prior art keywords
color space
component value
linear
luminance component
color
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2017542096A
Other languages
English (en)
Other versions
JP6516851B2 (ja
Inventor
ヤコブ ストレム,
ヤコブ ストレム,
ヨナタン サムエルソン,
ヨナタン サムエルソン,
Original Assignee
テレフオンアクチーボラゲット エルエム エリクソン(パブル)
テレフオンアクチーボラゲット エルエム エリクソン(パブル)
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by テレフオンアクチーボラゲット エルエム エリクソン(パブル), テレフオンアクチーボラゲット エルエム エリクソン(パブル) filed Critical テレフオンアクチーボラゲット エルエム エリクソン(パブル)
Publication of JP2018511210A publication Critical patent/JP2018511210A/ja
Application granted granted Critical
Publication of JP6516851B2 publication Critical patent/JP6516851B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G09EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
    • G09GARRANGEMENTS OR CIRCUITS FOR CONTROL OF INDICATING DEVICES USING STATIC MEANS TO PRESENT VARIABLE INFORMATION
    • G09G5/00Control arrangements or circuits for visual indicators common to cathode-ray tube indicators and other visual indicators
    • G09G5/02Control arrangements or circuits for visual indicators common to cathode-ray tube indicators and other visual indicators characterised by the way in which colour is displayed
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N9/00Details of colour television systems
    • H04N9/64Circuits for processing colour signals
    • H04N9/67Circuits for processing colour signals for matrixing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T3/00Geometric image transformations in the plane of the image
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/182Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a pixel
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/186Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a colour or a chrominance component
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/59Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial sub-sampling or interpolation, e.g. alteration of picture size or resolution
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/85Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression
    • H04N19/86Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression involving reduction of coding artifacts, e.g. of blockiness
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N9/00Details of colour television systems
    • H04N9/64Circuits for processing colour signals
    • H04N9/643Hue control means, e.g. flesh tone control
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N9/00Details of colour television systems
    • H04N9/64Circuits for processing colour signals
    • H04N9/646Circuits for processing colour signals for image enhancement, e.g. vertical detail restoration, cross-colour elimination, contour correction, chrominance trapping filters

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Hardware Design (AREA)
  • Processing Of Color Television Signals (AREA)
  • Color Image Communication Systems (AREA)
  • Color Television Systems (AREA)
  • Facsimile Image Signal Circuits (AREA)
  • Image Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Reduction Or Emphasis Of Bandwidth Of Signals (AREA)

Abstract

画素の前処理は、第1の色空間における画素の線形色に基づいて決定される第3の色空間におけるピクチャの画素の元の線形輝度成分値を得ることを含む。第2の色空間における非線形輝度成分値は、第2の色空間における第1の非線形クロマ成分値、第2の色空間における第2の非線形クロマ成分値、および、第3の色空間における元の線形輝度成分値に基づいて、画素に対して導出される。前処理は、そうでない場合にクロマサブサンプリングが非線形伝達関数と組み合わせて使用されるときに生じ得る輝度アーティファクトを低減する。【選択図】図8

Description

本実施形態は、一般的に、ピクチャ内の画素の前処理および符号化に関し、特に、画素の輝度値を改善する前処理および符号化に関する。
デジタルビデオ信号において、各サンプル、すなわち、画素成分は、整数または浮動小数点値によって表される。ビデオをレンダリングするスクリーン、テレビ、またはモニタなどのディスプレイは、ビデオ信号のデジタル値に基づいて可視光を除外する。デジタル値Vを可視光Yに変える関数は、光電気伝達関数(EOTF)である。従来、EOTFは、ガンマ関数と呼ばれる指数関数として表現されており、この場合、ガンマ(γ)は指数値である。これは典型的には、2.4(他の値の可能性もある):Y=Vγである。
ガンマ関数を使用することは、低輝度信号にはうまくいくが、輝度が100ニト(cd/m)を超えるとき、ガンマ関数は、人間の視覚系のコントラスト感度とうまく整合しない。したがって、より非線形である伝達関数は例えば以下のように規定される。
この伝達関数は、0から1までの範囲を超えるその一次導関数の最大値がガンマ関数の最大値より大きいという意味でガンマ関数よりも非線形である。
クロマサブサンプリングは、典型的には、データ量を低減する最初のステップとして圧縮前に行われる。4:2:2において、クロマ信号は、垂直方向において解像度が半分に低減される。4:2:0において、クロマ信号は、垂直方向および水平方向両方において解像度が半分に低減される。これは、典型的には、良質の信号を捕えるようにあるフィルタリング演算によって行われるが、最近傍法を使用して行うこともできる。
4:2:0または4:2:2のビデオを表示するために、デコーダはクロマ信号のアップサンプリングを行い、これは、双線形フィルタまたはより長いフィルタを使用して行うことが可能である。
しかしながら、非常に非線形の伝達関数、4:2:0または4:2:2サブサンプリング、および非一定輝度順序の組み合わせは、特に、飽和色、すなわち、色域の縁に近い色について、ビデオデータに対して極度のアーティファクトを引き起こす。
この問題に対処するいくつかのやり方がある。1つのやり方は、4:2:0または4:2:2のサブサンプリングを使用せずに代わりに4:4:4のサブサンプリングを使用することである。しかしながら、それは高価となり、なぜなら、4:2:0は圧縮前のビット数を半減させ、4:2:2はビット数を3分の2に低減するからである。別のやり方は、非常に非線形の伝達関数を使用しないことである。しかしながら、これは、暗い領域にバンディングを有することなしには非常に高いピーク明るさのコンテンツを表現することが難しいことを意味する。第3のやり方は、一定の輝度を使用する、すなわち、CIE1931 XYZ色空間に変換後に伝達関数を適用することである。しかしながら、このような解決策は、放送産業内で一般的な慣行に合わず、いくつかのシナリオでは、実現するのが困難であり、かつ費用がかかる恐れがある。
本発明の目的は、アーティファクトを抑制するために画素の前処理を行うことである。
これらのおよび他の目的は、本明細書に開示される実施形態によって満たされる。
実施形態の一態様は、ピクチャ内の画素を前処理する方法に関する。この方法は、第1の色空間における画素の線形色に基づいて決定される第3の色空間における画素の元の線形輝度成分値を得ることを含む。この方法はまた、第2の色空間における第1の非線形クロマ成分値、第2の色空間における第2の非線形クロマ成分値、および、第3の色空間における元の線形輝度成分値に基づいて、画素の第2の色空間における非線形輝度成分値を導出することを含む。
実施形態の別の態様は、ピクチャ内の画素を前処理するためのデバイスに関する。デバイスは、第1の色空間における画素の線形色に基づいて決定される第3の色空間における画素の元の線形輝度成分値を得るように構成される。デバイスはまた、第2の色空間における第1の非線形クロマ成分値、第2の色空間における第2の非線形クロマ成分値、および、第3の色空間における元の線形輝度成分値に基づいて、画素の第2の色空間における非線形輝度成分値を導出するように構成される。
実施形態の関連の態様は、ピクチャ内の画素を前処理するためのデバイスを規定する。デバイスは、第1の色空間における画素の線形色に基づいて決定される第3の色空間における画素の元の線形輝度成分値を得るための決定部を含む。デバイスはまた、第2の色空間における第1の非線形クロマ成分値、第2の色空間における第2の非線形クロマ成分値、および、第3の色空間における元の線形輝度成分値に基づいて、画素の第2の色空間における非線形輝度成分値を導出するための導出部を含む。
実施形態のさらなる態様は、ピクチャ内の画素を符号化するためのデバイスに関する。デバイスは、プロセッサと、プロセッサによって実行可能な命令を含むメモリとを含む。プロセッサは、第1の色空間における画素の線形色に基づいて決定される第3の色空間における画素の元の線形輝度成分値を得るように動作可能である。プロセッサはまた、画素の第2の色空間における非線形輝度成分値を、第2の色空間における第1の非線形クロマ成分値、第2の色空間における第2の非線形クロマ成分値、および、第3の色空間における元の線形輝度成分値に基づいて導出するように動作可能である。プロセッサは、非線形輝度成分値、第1の非線形クロマ成分値、および、第2の非線形クロマ成分値を符号化するようにさらに動作可能である。
実施形態の関連の態様は、ピクチャ内の画素を符号化するためのデバイスを規定する。デバイスは、第1の色空間における画素の線形色に基づいて決定される第3の色空間における画素の元の線形輝度成分値を得るための決定部を含む。デバイスはまた、画素の第2の色空間における非線形輝度成分値を、第2の色空間における第1の非線形クロマ成分値、第2の色空間における第2の非線形クロマ成分値、および、第3の色空間における元の線形輝度成分値に基づいて導出するための導出部を含む。デバイスは、非線形輝度成分値、第1の非線形クロマ成分値、および、第2の非線形クロマ成分値を符号化するためのエンコーダをさらに含む。
実施形態のさらに別の態様は、プロセッサによって実行されたとき、プロセッサに、第1の色空間における画素の線形色に基づいて決定される第3の色空間におけるピクチャの画素の元の線形輝度成分値を得させる命令を含むコンピュータプログラムに関する。プロセッサにはまた、第2の色空間における第1の非線形クロマ成分値、第2の色空間における第2の非線形クロマ成分値、および、第3の色空間における元の線形輝度成分値に基づいて、画素の第2の色空間における非線形輝度成分値を導出させる。
実施形態の関連の態様は、上記に従ってコンピュータプログラムを含むキャリアを規定する。キャリアは、電子信号、光信号、電磁信号、磁気信号、電気信号、無線信号、マイクロ波信号、または、コンピュータ可読記憶媒体のうちの1つである。
実施形態のさらなる態様は、ピクチャ内の画素の符号化バージョンを表す信号に関する。符号化バージョンは、第2の色フォーマットにおけるサブサンプリングされた第1の非線形クロマ成分値の符号化バージョンと、第2の色空間におけるサブサンプリングされた第2の非線形クロマ成分値の符号化バージョンと、上記に従って導出された、第2の色フォーマットにおける非線形輝度成分値の符号化バージョンとを含む。
本実施形態は、そうでない場合にクロマサブサンプリングと組み合わせた非線形伝達関数の使用によって生じ得るアーティファクトを抑制する画素の前処理および符号化を提供する。主観的には、輝度の品質改善は、非圧縮ビデオに対しても明確に可視である。
実施形態は、これらのさらなる目的および利点と共に、添付の図面と併せて以下の説明を参照することによって最も良く理解できる。
一実施形態による、画素の前処理方法を示すフローチャートである。 一実施形態による、図1に示される方法の追加の任意選択のステップを示すフローチャートである。 別の実施形態による、図1に示される方法の追加の任意選択のステップを示すフローチャートである。 一実施形態による、図3に示される方法の追加の任意選択のステップを示すフローチャートである。 図1における導出ステップを実施する一実施形態を示すフローチャートである。 一実施形態による、図5に示される方法の追加の任意選択のステップを示すフローチャートである。 一実施形態による、画素を符号化する方法を形成するための、図1に示される方法の追加のステップを示すフローチャートである。 一実施形態による、補正されたY’を導出する技術を示す図である。 種々な線形化が異なる領域で使用できることを示す図である。 エンコーダで、またはエンコーダに対する前処理で行うことができる方法を示すフローチャートである。 一実施形態による、デバイスのハードウェア実装形態の概略図である。 プロセッサおよびメモリによる実施形態によるデバイスの実装形態の概略図である。 一実施形態によるユーザ機器の概略図である。 関数モジュールを用いる実施形態による、デバイスの実装形態の概略図である。 複数のネットワークデバイスの中の実施形態の分散された実装形態を概略的に示す図である。 一実施形態による、1つまたは複数のクラウドベースのネットワークデバイスを有する無線通信システムの一例の概略図である。 Aは、圧縮されておらず、ダウンサンプリングおよびアップサンプリングのみの場合の、元の4:4:4のピクチャを示す図である。Bは、圧縮されておらず、ダウンサンプリングおよびアップサンプリングのみの場合の、従来の処理4:2:0の後のピクチャを示す図である。Cは、圧縮されておらず、ダウンサンプリングおよびアップサンプリングのみの場合の、提案された処理4:2:0の後のピクチャを示す図である。 Aは、圧縮されておらず、ダウンサンプリングおよびアップサンプリングのみの場合の、元の4:4:4のピクチャを示す図である。Bは、圧縮されておらず、ダウンサンプリングおよびアップサンプリングのみの場合の、従来の処理4:2:0の後のピクチャを示す図である。Cは、圧縮されておらず、ダウンサンプリングおよびアップサンプリングのみの場合の、提案された処理4:2:0の後のピクチャを示す図である。 元のピクチャ(下部)および処理されたピクチャ(上部)において、線形輝度の、CIE1931 XYZ空間におけるYがかなり異なっていることを示す図である。 個々の画素におけるY’値を変更することによって、所望の線形輝度Yに適合する線形輝度 に到達することができる技術を示す図である。
コントラスト感度のBarten曲線を示す図である。 Rec709の色域とBT.2020の色域との比較を示す図である。
図面全体を通して、同様の要素または対応する要素については同じ参照番号が使用される。
本実施形態は、一般的に、ピクチャ内の画素の前処理および符号化に関し、特に、画素の輝度値を改善する前処理および符号化に関する。
従来の圧縮の連鎖は、典型的には0〜10,000cd/mの入来する線形光の画素を逆伝達関数に与えることを伴い、これによって、0〜1の新しい画素値が生じる。この後に、画素に対して色変換が行われ、これによって、輝度成分および2つのクロマ成分が生じる。その後、2つのクロマ成分は、4:2:0または4:2:2など、サブサンプリングされる。展開後、4:2:0または4:2:2のシーケンスは、逆色変換される4:4:4にアップサンプリングされ、最終的に、伝達関数によってモニタ上で出力できる線形光の画素に戻される。
非常に非線形の伝達関数、クロマサブサンプリング、および非一定輝度順序の組み合わせは、特に飽和色について、ビデオデータに対して極度のアーティファクトを引き起こす。クロマ成分が補間されるのに対し、輝度成分は補間されないことから問題が生じる。故に、画素における輝度成分の急激なシフトがあり得るが、クロマ成分は補間されないためそうならない。特に飽和色といったいくつかの色について、完全に誤った強度の画素が生じ、これは、アーティファクトとして明確に可視になる。
実施形態による画素の前処理は、アーティファクトの強い影響を抑制するまたは少なくとも低減するために使用可能であり、それによって、入来する画素の「真の」色により近い色が生じる。
色空間または色フォーマットは、色モデルの色成分の組み合わせから生じる色のタイプおよび数である。色モデルは、色が数のタプル、すなわち色成分として表され得る様式を描写する抽象構成である。色成分は、成分のタイプ、例えば色相、およびその単位、例えば度またはパーセンテージ、または、スケールのタイプ、例えば線形または非線形、および、色の深さまたはビット深さと呼ばれる値のその意図される数などのいくつかの際立った特徴を有する。
ピクチャおよびビデオにおける画素に対して通常使用される、非限定的であるが例示的な色空間は、赤、緑、青(RGB)色空間、輝度、クロマ青、およびクロマ赤(YCbCr、時にはY’CbCr、Y’Cb’Cr’、YC、Y’C、またはY’C’C’と表記される)の色空間、ならびに輝度およびクロミナンス(XYZ)色空間を含む。
図1は、ピクチャ内の画素を前処理する方法を示すフローチャートである。方法は、ステップS1において、第1の色空間における画素の線形色に基づいて決定される第3の色空間における画素の元の線形輝度成分値を得ることを含む。次いで方法は、ステップS2に続き、このステップは、第2の色空間における第1の非線形クロマ成分値、第2の色空間における第2の非線形クロマ成分値、および、第3の色空間における元の線形輝度成分値に基づいて、画素の第2の色空間における非線形輝度成分値を導出することを含む。
図1における画素前処理は、第2の色空間における2つの非線形クロマ成分を採用する。第2の色空間における2つの非線形クロマ成分は、第2の色空間におけるサブサンプリングされた第1の非線形クロマ成分値、および、第2の色空間におけるサブサンプリングされた第2の非線形クロマ成分値とすることが可能である。特定の実施形態では、これらの2つの非線形クロマ成分はCb’成分およびCr’成分である。より好ましくは、非線形クロマ成分は、4:2:0または4:2:2フォーマットのCb’およびCr’成分である。したがって、第2の色空間は、この実施形態では、YCbCr色空間である。アポストロフィの「‘」は、2つのクロマ成分が非線形クロマ成分であることを示すために使用される。
このような場合、図1のステップS2は、好ましくは、第2の色空間におけるサブサンプリングされた第1の非線形クロマ成分値、第2の色空間におけるサブサンプリングされた第2の非線形クロマ成分値、および、第3の色空間における元の線形輝度成分値に基づいて、第2の色空間における非線形輝度成分値を導出することを含む。
代替的な実施形態では、第2の色空間における2つの非線形クロマ成分値は、必ずしもサブサンプリングされなくてもよい。これらの成分値は、むしろ、第2の色空間におけるサンプリングされない非線形クロマ成分値、および第2の色空間におけるアップサンプリングされた非線形クロマ成分値の形態とすることができ、この場合、アップサンプリングされた非線形クロマ成分値は、第2の色空間におけるサブサンプリングされた非線形クロマ成分値のアップサンプリング後に得られる。この代替的な実施形態では、非線形クロマ成分は、4:4:4フォーマットにおけるCb’成分およびCr’成分である。
一実施形態では、画素の第2の色空間における第1の非線形クロマ成分値および第2の非線形クロマ成分値は、第1の色空間における画素の線形色に基づいて得られる。特定の実施形態では、この第1の線形色空間はRGB色空間である。したがって、第1の色空間における画素の線形色は、この特定の実施形態では、画素のRGB色である。
一実施形態では、上で述べられる第3の色空間はXYZ色空間である。したがって、第3の色空間における画素の線形輝度は、この実施形態ではY成分である。
よって、図1の前処理によって、第1の色空間における画素の線形色に基づいて決定される第3の色空間における画素の元の線形輝度成分値が得られるまたは提供される。この元の線形輝度成分値は、好ましくは、画素の真の輝度、すなわち、任意の色変換、伝達関数の適用、およびサブサンプリングの前の画素の元の輝度を反映する。この元の線形輝度成分値は、第1の色空間における画素の線形色に基づいて決定される。一実施形態では、第1の色空間における画素のこの線形色は、画素の、入来する元の色である。特定の実施形態では、この入来する元の色は、本明細書ではRと表記され、元の線形輝度成分はYと表記される。
よって、元の線形輝度は、多くの種々なやり方で算出可能な目標輝度である。この元の線形輝度は、ピクチャを撮るまたはビデオ録画するカメラにおける、またはディスプレイのパネルにおけるセンサの実際の輝度に直接必ずしも対応しなくてもよい。
第3の色空間における元の線形輝度成分値は、あらかじめ決定されるまたはあらかじめ算出される形態で、好ましくはY値である元の線形輝度成分値として前処理および符号化機能に対して得られることが可能である。これは、第1の色空間における線形色に基づく、元の線形輝度成分値の決定が既に行われており、前処理および符号化機能にはその決定の結果のみが提供されることを意味する。
代替的な実施形態では、実施形態の前処理は、元の線形輝度成分値の決定または算出を含む。このような実施形態では、図1のステップS1は、好ましくは、第1の色空間における線形色に基づいて第3の色空間における元の線形輝度成分値を決定することを含む。
次いで、第2の色空間における非線形輝度成分値は、第2の色空間における第1の非線形クロマ成分値および第2の非線形クロマ成分値、ならびに、第3の色空間における元の線形輝度成分値に基づいて、ステップS2において画素に対して導出される。故に、一実施形態では、YCbCr色空間における非線形輝度成分Y’は、YCbCr色空間におけるCb’およびCr’成分、ならびに、XYZ色空間におけるY成分の関数、すなわち、Y’=f(Cb’、Cr’Y)である。次に、Y成分は、RGB色空間における画素のR色に基づいて決定される、すなわち、Y=g(R、G、B)になる。したがって、Y’=f(Cb’、Cr’g(R、G、B))である。
前処理された画素は、次いで、導出された非線形輝度成分(Y’)、および、第2の色空間における2つサブサンプリングされた非線形クロマ成分(Cb’、Cr’)、すなわち、Y’Cb’Cr’によって表される。よって、タプルY’Cb’Cr’は、前処理された画素の色を、好ましくは4:2:0または4:2:2フォーマットで、すなわち、サブサンプリングされない輝度成分を除くサブサンプリングされたクロマ成分で表す。
一実施形態では、図1のステップS2は、第2の色空間における非線形輝度成分値、第2の色空間における第1の非線形クロマ成分値、および、第2の色空間における第2の非線形クロマ成分値に基づいて決定される、第3の色空間における元の線形輝度成分値と第3の色空間における線形輝度成分値との間の差異を最小化する第2の色空間における非線形輝度成分値を導出することを含む。
故に、この実施形態では、ステップS2は、第3の色空間(XYZ)における、元の線形輝度成分(Y)値と線形輝度成分(Y)値との間の差異を最小化する第2の色空間(YCbCr)における非線形輝度成分(Y’)値を見つけることを伴う。第3の色空間(XYZ)における線形輝度成分(Y)値は、次に、第2の色空間(YCbCr)における、非線形輝度成分(Y’)値および2つの非線形クロマ成分(Cb’Cr’)値に基づいて得られる。
よって、この実施形態は、差異|Y−Y|または(Y−Y)を最小化するY’成分値を見つけることを伴う。この場合、Y=h(Y’Cb’Cr’)であり、h(.)はYがY’、Cb’、およびCr’に基づいて決定されることを規定する。
代替的であるが関連の実施形態では、ステップS2は、第3の色空間における元の輝度成分値の関数と第3の色空間における線形輝度成分値の関数との間の差異を最小化する第2の色空間における非線形輝度成分値を導出することを伴う。第3の色空間におけるこの線形輝度成分値は、第2の色空間における非線形輝度成分値、第2の色空間における第1の非線形クロマ成分値、および第2の色空間における第2の非線形クロマ成分値に基づいて決定される。
よって、この実施形態は、差異|k(Y)−k(Y)|または(k(Y)−k(Y))を最小化するY’成分値を見つけることを伴う。式中、Y=h(Y’Cb’Cr’)である。
関数(k(.))は、好ましくは、International Organization for Standardization、ISO/IEC JTC1/SC29/WG11、Coding of moving pictures and audio、MPEG2013/M35255、2014年10月、ストラスブール、フランスのFrancoisらの「About using a BT.2020 container for BT.709 content」の伝達関数[1]の逆関数などの、逆伝達関数である。
図1の方法ステップS1およびS2は、ビデオシーケンスなどのピクチャにおける少なくとも1つの画素に対して行われる。一実施形態では、ステップS1およびS2は、好ましくは、ピクチャにおける複数の、すなわち少なくとも2つの画素に対して行われる。これは、線L1によって概略的に示される。特定の実施形態では、ステップS1およびS2はピクチャにおける全ての画素に対して行われる。
別の特定の実施形態では、ステップS1およびS2は、本明細書に先に説明されたような視覚的アーティファクトを生じさせる、ピクチャにおけるような画素に対して行われる。これらの画素は、画素に対する第3の色空間における元の線形輝度成分(Y)値と、第2の色フォーマットにおける非線形輝度およびクロマ成分(Y’Cb’Cr’)値に基づいて画素に対して決定される第3の色空間における線形輝度成分(Y)値とを比較することによって特定可能であり、これらの非線形輝度およびクロマ成分値は、本発明に従って、いずれの前処理も行わずに典型的な圧縮の連鎖に従って導出される。すぐ前の実施形態では、実施形態の前処理は、結果的に、ピクチャにおけるそれらの画素に適用されるだけであり、これら画素において、典型的な圧縮の連鎖によって輝度成分の誤差が生じる。
代替的には、視覚的アーティファクトを生じさせるピクチャ内の画素は、Cb’およびCb成分値ならびに/またはCr’およびCr成分値、すなわち、アップサンプリングされたCb’および/またはCr’成分値と、第1の色変換をR’G’B’色に適用することによって得られる対応するCbおよび/またはCr’成分値とを比較することによって特定可能である。この場合、R’、G’、およびB’は、逆伝達関数を、元のR色のR、G、およびBそれぞれに適用することによって得られる。
さらなる変形は、飽和色、すなわち、色域の縁におけるまたはこれに近い色を有するそれらの画素に対してステップS1およびS2を行うことである。
図2は、図1に示される方法の追加の任意選択のステップを示すフローチャートである。図2のステップは、第1の色空間における線形色に基づいて第2の色空間におけるサブサンプリングされた非線形クロマ成分値を導出するために使用される典型的な処理の連鎖を示す。方法はステップS10で開始し、このステップは、第1の色空間における非線形色を捕えるために第1の色空間における線形色に第1の伝達関数を適用することを含む。次のステップS11は、第2の色空間における非線形色を捕えるために第1の色空間における非線形色に第1の色変換を適用することを含む。第2の色空間における非線形色は、最初の第1の非線形クロマ成分値および最初の第2の非線形クロマ成分値を含む。続くステップS12は、第2の色空間におけるサブサンプリングされた第1の非線形クロマ成分値および第2の色空間におけるサブサンプリングされた第2の非線形クロマ成分値を捕えるために、第2の色空間における最初の第1の非線形クロマ成分値および第2の色空間における最初の第2の非線形クロマ成分値をサブサンプリングすることを含む。方法は次いで、図1におけるステップS1に続く。
図2の典型的な処理の連鎖の一実施形態では、伝達関数[1]の逆関数などの第1の伝達関数は、RGB色空間における非線形色R’G’B’を捕えるために、画素のR色、すなわち、画素の元の色に適用される。R’G’B’色は次いで、色変換などの第1の色変換を使用してRGB色空間からYCbCr色空間に色変換される。
Y=0.299R+0.587G+0.114B
Cb=−0.168736R−0.331264G+0.5B
Cr=0.5R−0.418688G−0.081312B
ステップS11における第1の色変換の適用後に生じる画素のY’Cb’Cr’色は、要するに4:4:4フォーマットにおける非圧縮のY’Cb’Cr’色である。以下のステップS12では、4:2:0または4:2:2フォーマットにおける色を捕えるために2つのクロマ成分Cb’およびCr’をサブサンプリングする、要するに、非線形クロマ成分Cb’およびCr’がサブサンプリングされている。
ステップS12におけるサブサンプリングは、既知のサブサンプリング技法に従って行われることが可能である。例えば、フィルタリング演算または最近傍演算が使用可能である。実施形態に従って使用できるサブサンプリング技法の一例は、International Organization for Standardization、ISO/IEC JTC1/SC29/WG11、Coding of moving pictures and audio、MPEG2014/N15083、2015年2月、ジェノバ、スイスのLuthraらの「Call for Evidence (CfE) for HDR and WCG Video Coding」の文献[4]における、セクションB.1.5.5、「Chroma downsampling from 4:4:4 to 4:2:0」に開示されている。
図3は、図1に示される方法の追加の任意選択のステップを示すフローチャートである。これらのステップは、ピクチャ内の画素の最適な非線形輝度成分値を導出するための追加の処理を示す。方法は、図1におけるステップS1または図2におけるステップS12から続く。方法は、ステップS20における、第2の色空間におけるアップサンプリングされた第1の非線形クロマ成分値および第2の色空間におけるアップサンプリングされた第2の非線形クロマ成分値を捕えるために、第2の色空間におけるサブサンプリングされた第1の非線形クロマ成分値および第2の色空間におけるサブサンプリングされた第2の非線形クロマ成分値をアップサンプリングすることによって、続行する。次のステップS21は、第1の色空間における非線形色を捕えるために、第2の色空間における候補の線形輝度成分値、第2の色空間におけるアップサンプリングされた第1の非線形クロマ成分値、および第2の色空間におけるアップサンプリングされた第2の非線形クロマ成分値に第2の色変換を適用することを含む。次のステップS22は、第1の色空間における非線形色を捕えるために第2の色空間における非線形色に第2の伝達関数を適用することを含む。最終的に、第3の色変換は、ステップS23において、第3の色空間における線形輝度成分値を捕えるために第1の色空間における線形色に適用される。方法はその後、図1におけるステップS2に続き、このステップは、第3の色空間における元の線形輝度成分値と第3の色空間における線形輝度成分値との比較に基づいて非線形輝度成分値を導出することを含む。
よって、一実施形態では、4:2:0または4:2:2フォーマットのサブサンプリングされたCb’およびCr’成分値は、初めに4:4:4フォーマットにアップサンプリングされる。ステップS20におけるアップサンプリングは、既知のアップサンプリング技法に従って行われることが可能である。例えば、アップサンプリングは、双線形フィルタまたはより長いフィルタを使用することによって行うことができる。実施形態に従って使用可能であるアップサンプリング技法の一例は、文献[4]における、セクションB.1.5.6、「Chroma upsampling from 4:2:0 to 4:4:4(Y’CbCrドメイン)」に開示されている。
これらの2つのアップサンプリングされたCb’およびCr’成分値は、次いで、色変換などの非線形R’G’B’色を捕えるために、候補のY’成分値と共に、第2の色変換に入力される。
R’=Y’+a13Cr’
G’=Y−a22b’−a23Cr’
B’=Y+a32Cb’
Rec.709の色空間については、a13=1.57480、a22=0.18732、a23=0.46812、a32=1.85560であり、BT.2020の色空間については、a13=1.47460、a22=0.16455、a23=0.57135、a32=1.88140である。
一般的に、R’、G’、およびB’は、間隔[0、1]内の値を仮定できる。したがって、第2の色変換は、R’成分に対するR’=clip(Y’+a13Cr’、0.1)などのクランプまたはクリップ演算を含むこともできる。この場合、clip(x、a、b)は、x<aである場合はaに等しく、x>bである場合はbに等しく、その他の場合はxに等しい。
このR’G’B’色は、その後、伝達関数[1]などの第2の伝達関数に入力されて、線形RGB色を捕える。このRGB色は、次いで、下記の色変換などの第3の色変換を使用してRGB色空間からXYZ色空間に変換される。
X=0.636958R+0.144617G+0.168881B
Y=0.262700R+0.677998G+0.059302B
Z=0.000000R+0.028073G+1.060985B
第3の色変換から出力された線形輝度成分Y値は、次いで、ステップS2における画素の元の線形輝度成分Y値と比較される。
一実施形態では、図1のステップS2は、第3の色空間における元の線形輝度成分値と第3の色空間における線形輝度成分値との間の差異を低減する、第2の色空間における候補の非線形輝度成分値を選択することを含む。
よって、ステップS2は、好ましくは、元の線形輝度成分値とステップS23において得られた線形輝度成分値との間の差異の少なくとも低減をもたらす、第2の色空間における候補の非線形輝度成分値を選択することを含む。特定の実施形態では、ステップS2は、第3の色空間における、元の線形輝度成分値と線形輝度成分値との間の差異を最小化する、第2の色空間における候補の非線形輝度成分値を選択することを含む。
この差異は、前述されるように、|Y−Y|または(Y−Y)として表すことが可能である。この場合、Yは図3のステップS23で得られる。
代替的ではあるが関連の実施形態では、ステップS2は、第3の色空間における元の輝度成分値の関数と第3の色空間における線形輝度成分値の関数との間の差異を、低減する、好ましくは最小化する、第2の色空間における候補の非線形輝度成分値を選択すること、すなわち、差異|k(Y−)−k(Y)|または(k(Y)−k(Y))を最小化する候補のY’成分値を選択することを伴う。
一実施形態では、図3におけるステップS21〜S23は、第2の色空間における種々な候補の非線形輝度成分値に対して行われ、これは線L2によって概略的に示される。このような場合、ステップS2は、好ましくは、第3の色空間における元の線形輝度成分値と第3の色空間における線形輝度成分値との間の最小差異、または、第3の色空間における元の線形輝度成分値の関数と第3の色空間における線形輝度成分値の関数との間の最小差異を生じさせる、第2の色空間における種々な候補の非線形輝度成分値の中から候補の非線形輝度成分値を選択することを含む。
これは、ステップS21〜S23のループが複数回行われ、かつ、ステップS21における種々な候補のY’成分値を使用することを意味する。後に、YとYとの間またはk(Y)とk(Y)との間の最小差異をもたらす候補のY’成分値は次いで選択され、かつ、画素の色表現としてのサブサンプリングされたCb’およびCr’成分値と共に使用される。
続く実施形態では、第3の色空間における元の線形輝度成分値と第3の色空間における線形輝度成分値との間の差異に関してより詳細に説明される。これらの実施形態はまた、第3の色空間における元の線形輝度成分値の関数と第3の色空間における線形輝度成分値の関数との間の差異を包含する。該関数は、好ましくは、本明細書に先述されるように、伝達関数[1]の逆関数などの伝達関数の逆関数である。
複数の候補のY’成分値の中からの最適な候補のY’成分値の選択は、本明細書にさらに説明されるようにさまざまな実施形態に従って行うことが可能である。
第1の実施形態は二分探索を行うことを伴う。故に、この実施形態では、方法は、第3の色空間における元の線形輝度成分値と第3の色空間における線形輝度成分値との間の差異を最小化する第2の色空間における候補の非線形輝度成分値を選択するために二分探索を行うことを含む。
二分探索は、最適な候補の非線形輝度成分値を見つけるために使用可能である効率的な技法である。一般的に、二分探索アルゴリズムは、第3の色空間における元の輝度成分値と、第2の色空間における可能な候補の非線形輝度成分値の分類されたアレイの中間要素を使用して得られる第3の色空間における線形輝度成分値とを比較することによって始める。第3の色空間における線形輝度成分値が第3の色空間における元の線形輝度成分値に等しい、または、既定量未満で、第3の色空間における元の線形輝度成分値と異なっている場合、中間要素の位置に戻され、この探索を終える。線形輝度成分値が元の線形輝度成分値を上回る場合、この探索は該アレイの下半分について続行する、または、線形輝度成分値が元の線形輝度成分値を下回る場合、この探索は該アレイの上半分について続行する。このプロセスは、要素の半分を削除すること、および、生じる線形輝度成分値と元の線形輝度成分値とを、その間の差異がゼロになるまで、またはアレイ全体が探索されるまで、すなわち、1以外の全ての要素が削除されるまで比較することを続行する。これは、log(N)ステップのみに保証され、この場合、Nはアレイにおける可能な候補の非線形輝度成分値の数である。例えば、候補の非線形輝度成分値が[0、1023]のアレイから選択可能であると仮定する。すると、N=1024であり、log(1024)=10である。
一実施形態では、二分探索は、探索間隔の中ほどで第2の色空間における候補の非線形輝度成分値に対して図3におけるステップS21〜S23を行うことによって行われる。方法は、次いで、図4に示されるステップを続行する。以下のステップS25は、好ましくはステップS24において算出される際に、第3の色空間における元の輝度成分値と第3の色空間における線形輝度成分値との間の差異がゼロに等しい場合、探索間隔の中ほどで候補の非線形輝度成分値を選択することを含む。その他の場合、すなわち、ステップS24において算出された差異がゼロに等しくない場合、方法はステップS26を続行する。このステップS26は、上で使用される探索間隔と比較するとサイズが半分の探索間隔を選択すること、および、第3の色空間における線形輝度成分値が第3の色空間における元の線形輝度成分値より大きい場合、上で使用される候補の非線形輝度成分値で終了すること、または、上で使用される探索間隔と比較するとサイズが半分の探索間隔を選択すること、および、第3の色空間における線形輝度成分値が第3の色空間における元の線形輝度成分値より小さい場合、上で使用される候補の非線形輝度成分値で開始することを含む。
ループL2、すなわちステップS21〜S23およびS24〜S26を伴うステップは、その後、第3の色空間における元の線形輝度成分値と第3の色空間における線形輝度成分値との間の差異がゼロに等しくなる、探索間隔がこれ以上半分にすることができなくなる、ループが既定回数繰り返されている、または探査間隔があらかじめ定められた間隔のサイズに到達している、すなわち、探索間隔があらかじめ定められた間隔のサイズより小さくなる、または等しくなるまで、繰り返される。
ステップS26における探索間隔の選択は、一般的に、上で使用される探索間隔と比較すると、サイズがおよそ半分の探索間隔を選択することを伴う。例えば、探索間隔が値100、101、102、103を含有する場合、「中央値」として101または102のどちらかを選定することができ、これによって、[100、101](探索間隔の真の半減)もしくは[101、103](探索間隔のほぼ半減)の「半減した」探索間隔、または、[100、102](探索間隔のほぼ半減)もしくは[102、103](探索間隔の真の半減)の「半減した」探索間隔が生じる。
別の実施形態は非線形輝度成分値の選択を最適化問題と見なすことであり、Y’に対する誤差E=(Y−Y)またはE=|Y−Y|を最小化する。これは、例えば、Y’に対するEの勾配を算出すること、すなわち、dE/dY’による、勾配降下によって行うことができ、勾配の反対方向に少量Y’を更新すること、すなわち、式中、αは小定数として、Y’n+1=Y’−α(dE/dY’)が可能である。
勾配降下は低速になり得るため、二階微分値dE/dY’を算出するまたは概算する二次最適化アルゴリズムを使用するより迅速なやり方を取ることができる。ガウス−ニュートンはかかるアルゴリズムの一例である。
さらなる実施形態は、非線形輝度成分値を選択するとき、ルックアップテーブル(LUT)を使用することを伴う。このようなLUTは、例えば、Cb’、Cr’、およびY成分値のあらゆる可能な組み合わせに対する最良のY’成分値を含むことができる。例えば、Cb’およびCr’成分が10ビットまで量子化され、かつ、Y成分も10ビットまで量子化されると仮定する。さらに、LUTは、210×210×210異なるY’成分値を含有するものとする。これは、230のY’成分値と同等である。各このようなY’成分値が2バイトである場合、LUTは231バイトまたは2Gbを有することになる。
より小さいLUTを使用することも可能とすることができる。例えば、Y、Cb’、およびCr’成分をより小さいサイズ、例えば6ビットに量子化可能とすることができる。さらに、LUTは、218Y’成分値、または512kbに等しい219バイトとなる。
成分は線形であるため、該成分をただ量子化することは非効率である場合がある。むしろ、最適なY’成分を捕えるためにLUTへの入力としてCb’およびCr’と共にYの関数を使用することがより良い場合がある。該関数は、好ましくは、Y成分の非線形表現を出力し、例えば、伝達関数[1]の逆関数などの逆伝達関数(TF−1(.))とすることができる。最適なY’成分値は、その後、Y’=LUT(Cb’、Cr’、TF−1(Y))としてLUTから導出される。
図5は、LUTを使用するときの、図1におけるステップS2の一実施形態を示すフローチャートである。方法は、図1のステップS1から続行する。次のステップS30は、第2の色空間におけるアップサンプリングされた第1の非線形クロマ成分値、および第2の色空間におけるアップサンプリングされた第2の非線形クロマ成分値を捕えるために、第2の色空間におけるサブサンプリングされた第1の非線形クロマ成分値、および第2の色空間におけるサブサンプリングされた第2の非線形クロマ成分値をアップサンプリングすることを含む。
次のステップS32は、ルックアップテーブルへの入力として、第3の色空間における元の非線形輝度成分値、またはこの非線形バージョン、第2の色空間におけるアップサンプリングされた第1の非線形クロマ成分値、および第2の色空間におけるアップサンプリングされた第2の非線形クロマ成分値、またはこの量子化バージョンを使用して、ルックアップテーブルから第2の色空間における非線形輝度成分値を検索することを含む。
図6は、図5に示される方法の追加の任意選択のステップを示すフローチャートである。方法は図5におけるステップS30から続行する。次のステップS31は、第3の色空間における元の非線形輝度成分値を捕えるために第3の色空間における元の線形輝度成分値に第1の逆伝達関数を適用することを含む。方法は次いで、図5におけるステップS32に続行する。この実施形態では、ステップS32は、ルックアップテーブルへの入力として、第3の色空間における元の非線形輝度成分値、第2の色空間におけるアップサンプリングされた第1の非線形クロマ成分値、および第2の色空間におけるアップサンプリングされた第2の非線形クロマ成分値、またはこの量子化バージョンを使用して、ルックアップテーブルから第2の色空間における非線形成分値を検索することを含む。
一実施形態では、ルックアップテーブルは、第3の色空間における元の非線形輝度成分値、またはこの非線形バージョン、第2の色空間におけるアップサンプリングされた第1の非線形クロマ成分値、および第2の色空間におけるアップサンプリングされた第2の非線形クロマ成分値、またはこの量子化バージョンの各組み合わせに対して、第2の色空間における最適な非線形輝度成分値、第2の色空間におけるサブサンプリングされた第1の非線形クロマ成分値、および第2の色空間におけるサブサンプリングされた第2の非線形クロマ成分値に基づいて決定される、第3の色空間における元の非線形輝度成分値と第3の色空間における非線形輝度成分値との間の差異を最小化する、第2の色空間における最適な非線形輝度成分値を含む。
図3におけるステップS20および図5におけるステップS5で行われる際の、第2の色空間における非線形クロマ成分値のアップサンプリングは、好ましくは、第2の色空間における非線形輝度成分値と同じ数のサンプルに、非線形クロマ成分値をアップサンプリングする。よって、これらのステップにおいて行われるアップサンプリングは、好ましくは、図2におけるステップS12などにおいて、任意のサブサンプリングの適用の前と同じ数のサンプルを有する非線形クロマ成分値をもたらす。これは、サブサンプリングおよび続くアップサンプリングの前に、Y’、Cb’、およびCr’成分全てが、4:4:4フォーマットなどにおいて同じ数のサンプルを含むことを意味する。サブサンプリング後、Y’成分は、Cb’およびCr’成分と比較するとより多くのサンプルを含み、好ましくは、4:2:0または4:2:2フォーマットなどにおいて、同じ数のサンプルを含む。
ピクチャ内の画素は、本明細書に説明されるように導出されるのが好ましい、第2の色空間における非線形輝度成分値を有する。画素に関連付けられ、かつアップサンプリング後に得られる第2の色空間における非線形クロマ成分値は、アップサンプリング技法によって、第2の色空間におけるそれぞれのサブサンプリングされた第1の非線形クロマ成分値および第2の非線形クロマ成分値に基づいて、または、第2の色空間における複数のサブサンプリングされた第1の非線形クロマ成分値および第2の非線形クロマ成分値に基づいて、生成可能である。例えば、双線形アップサンプリングが使用される場合、4つのサブサンプリングされたCb’成分値、および4つのサブサンプリングされたCr’成分値は、アップサンプリングされたCb’およびCr’成分の画素および値に影響を及ぼすことになる。それに応じて、最近傍アップサンプリングが使用される場合、典型的には、単一のサブサンプリングされたCb’成分値、および単一のサブサンプリングされたCr’成分値は、画素のアップサンプリングされたCb’およびCr’成分値を導出するために使用される。
実施形態による画素の前処理は、種々な応用例で、特に、ビデオ符号化を含む種々なビデオ応用例で使用可能である。
したがって、一実施形態は、ピクチャ内の画素を符号化する方法に関する。方法は、画素の第2の色空間における非線形輝度成分値を導出するために本明細書に開示されるような実施形態のいずれかに従って画素を前処理することを含む。方法はまた、図7に示されるステップS3において、非線形輝度成分値、第2の色空間におけるサブサンプリングされた第1の非線形クロマ成分値、および、第2の色空間におけるサブサンプリングされた第2の非線形クロマ成分値を符号化することを含む。
よって、画素の前処理は、ビデオシーケンスのピクチャを符号化することなどに関連して、ピクチャの画素の符号化中の追加の処理として使用可能である。
4:2:0または4:2:2フォーマットなどにおける前処理の出力、すなわちY’Cb’Cr’は、次いで、H.264ビデオエンコーダ、高効率ビデオエンコーダ(HEVC)、H.265ビデオエンコーダ、または、別のビデオエンコーダなどのビデオエンコーダに入力される。ビデオエンコーダによって行われる符号化は、インター予測、イントラ予測、モード判断、残留変換、および、例えば、コンテキスト適応型二値算術符号化方式(CABAC)エンコーダといった、エントロピーエンコーダなどにおいて、変換されかつ量子化された残差の量子化および符号化などの従来のビデオ符号化ステップを含むことができる。
実施形態を前処理する利点は、ビデオエンコーダまたはピクチャエンコーダにおけるいずれの調節も、または対応するビデオデコーダまたはピクチャデコーダにおけるいずれの調節も行う必要なく、いずれのビデオまたはピクチャ符号化プロセスにも適用可能であることである。明確な対照をなして、前処理は、追加の処理、すなわち、伝達関数の適用、色変換の適用、およびクロマサブサンプリングを伴う、Y’Cb’Cr’色への、符号化されるべきピクチャ内の画素のR色といった、元の色の従来の転換の代わりに、入力されたピクチャに適用される前処理として、理解できる。
ビデオシーケンスなどのピクチャ内の画素の前処理はまた、ビデオ符号化以外の他の応用例で使用可能である。例えば、実施形態は、高精細マルチメディアインターフェース(HDMI)、ディスプレイポート、またはサンダーボルトといった、インターフェース上でビデオを転送する前に適用される前処理として使用可能である。例えば、HDMI2.0aにおいて、毎秒50または60フレーム(fps)で4K解像度を伝達するただ1つのやり方は、4:2:0または4:2:2のYCbCrサブサンプリングを使用することである。ビデオデータが完全なクロマサンプリングフォーマット(4:4:4)である場合、サブサンプリング前処理ステップは、HDMIケーブル上でビデオデータを送る前に適用されなければならない。4:2:0または4:2:2のビデオデータは、次いで、さらなる圧縮なくインターフェース上で転送される。実施形態の前処理を適用することによって、ビデオ品質は、Y’成分のいずれの補正も、または最適なY’成分の発見もない従来の4:2:0または4:2:2のサブサンプリングと比較して改善されている。
典型的な圧縮の連鎖について後述されている。例えば、0から10,000までの範囲の入来する線形光画素(R、G、B)は、初めに伝達関数に与えられ、それによって、0〜1の新しい画素(R’、G’、B’)がもたらされる。この後、画素は色変換され、これによって(Y’、Cb’、Cr’)がもたらされる。次いで、Cb’およびCr’成分は4:2:0にサブサンプリングされる。
展開後、4:2:0のシーケンスは、再び4:4:4にアップサンプリングされ、逆色空間転換によって(R’、G’、B’)がもたらされ、最終的に、逆伝達関数によってモニタ上で出力できる線形光画素(R、G、B)に戻される。
Cb’およびCr’成分が補間されるのに対し、Y’成分は補間されないことから問題が生じる。故に、画素におけるY’成分の急激なシフトがあり得るが、Cb’およびCr’成分は補間されないためそうならない。いくつかの色、とりわけ飽和色について、完全に誤った強度の画素が生じ、これは、明確に可視である。
これらの場合では、補間された色から生成されたタプル(Y’、Cb’、Cr’)が元のものとそれほど異ならないようにY’成分を変更することが提案される。理想的には、その差異は、はっきりしないくらい小さいものとする。
基本的に、Cb’およびCr’成分が偽であるという認識が生じることで、Y’成分も偽とし、それによって(Y’、Cb’、Cr’)は真の色により近くなる。換言すれば、Y’成分に誤差を導入することによって、Cb’およびCr’成分に既に存在している誤差を補償して、実際の画素により近づけることができる。例えば、初めにクロマ(4:2:0)をサブサンプリング後(4:4:4へ)アップサンプリングすることから捕えるCb’をサブサンプリング前の元のCb’444およびCr’444値と比較することによって、(Cb’−Cb’444)および(Cr’−Cr’444)を閾値と比較することによって、Cb’およびCr’成分が偽であると決定することができる。
補正されたY’成分は後述される異なる実施形態に従って導出可能である。故に、補正されたY’成分、ならびにCb’およびCr’成分は次いで圧縮されることで、画像またはビデオがより高い品質で感知されることになる。
Y’成分を変更する、すなわち、補正されたY’成分を導出することによって、もたらされる輝度値を補償できる。目は、クロミナンス変化よりも輝度変化に対してはるかにずっと敏感であるため、第1のルールは、輝度が元の値からそれほど多くずれていないことを確認することとする。
上述されるように、非線形輝度Y’は、画素の線形輝度Yがその補正値により近くなるように、圧縮前に調節される。これはさらに後述される。
例えば0〜96画素のスクリーンの左部分が値(2142、0、138)を有し、例えば97〜1920画素のスクリーンの右部分が値(2142、4、138)を有するピクチャを仮定する。従来の処理の連鎖によって、表1の結果がもたらされることになる。
ここで、Y値は線形輝度である。すなわち、元のY値は、元の線形光RGB(2142、4、138)を捕え、かつこれをXYZに転換するときに捕えられる値である。例えば、RGBがBT.2020色空間にある場合、以下を使用して転換できる。
X=0.636958×R+0.144617×G+0.168881×B
Y=0.262700×R+0.677998×G+0.059302×B
Z=0.000000×R+0.028073×G+1.060985×B
このY成分は、目に敏感な輝度である。該Y成分は、RGBに非線形的に依存する、上記のY’成分と混同しないようにすべきである。
表1においてわかるように、Y値は、RGB4:2:0のサブサンプリングおよびアップサンプリングを使用するとき、画素97に対して大きく誤っている。この例では、圧縮は行われておらず、10ビットに対する量子化のみが行われ、しかも、Y値は85%の相対誤差を有する。目で見ることができる差異がどれほど大きいかを予測するBartenのモデルを使用して、この誤差が195のBartenステップである、または、ただ目につくこととなるであろうものより195倍大きいことがわかる。
表2を見ると、何が起こっているかがわかる。
Cb’成分を見る場合、この成分は値607を有し、これは、不連続点、すなわち画素94の前の650と、不連続点の後の575との間のほぼ中間であるが、正しい値は575である。その誤差は画素のクロミナンスだけでなく輝度にも影響を及ぼし、画素を大きくし過ぎることになるという問題がある。本発明者らの着想は、これを、画素のY’成分を変更することによって補償することである。実施形態によると、Y成分を、画素に対して422とせずに、代わりに値363を選択する。表3では、その結果を示す。
ここで、新しい色がその正しい値にさらに一層類似していることがわかる。緑成分は誤った方向に向かっているが、1.72cd/mのみである。しかしながら、同時に、赤成分はその正しい値のほぼ半分であって、動きが1849cd/mあり、青成分は同様に変化している。表4では、輝度に何が起こるかを示す。
表4に見られるように、輝度Yにおいてよりはるかに小さい誤差が生じる。相対誤差は0.2465%であり、これは、Bartenステップの0.5602と同等である、すなわち、見ることは不可能である。
誤差は、ここではむしろクロミナンスにあるが、人間の視覚系が輝度ほどクロミナンスにおいては誤差に敏感ではないことを考えると、これは大した問題ではない。さらに、サブサンプリングが行われるため、いずれにしてもクロミナンスに誤差が生じることになる。また、Y’成分を変更して、輝度における誤差とクロミナンスにおける誤差との間で良好なトレードオフを生じさせることが可能である。
さらに、クロミナンスの変化ははっきりしない場合さえあり、その差異は、緑成分が3.9750cd/mではなく0.7008cd/mだけであるが、これは、ほぼ1000倍大きい2145であるため、たいがいは、いずれにしても赤成分によって小さくされる。この変化を見るための別のやり方では、緑成分と赤成分との間の割合が、正しい3.9750/2142.6617=0.001855ではなく、0.7008/2145.11=0.000327となる。色相のこのわずかなシフトを人間の目で見ることが可能であるかは明らかでない。故に、ただ目につくものより200倍大きい輝度の誤差を、見ることができないかもしれない程小さいクロミナンスの誤差と交換されている。
良い点としては、変更されたY’値のみが個々の画素に影響することである。故に、Y’成分を変更することによって他の画素が犠牲になることはない。
一実施形態では、値Y’は、Cb’およびCr’の特有の値に対して最適化されない。むしろ、Y’値は、Cb’およびCr’のいくつかの異なる値に対する、または、Cb’およびCr’値の範囲に対する輝度誤差を最小化するように選択される。これは、クロマアップサンプリング方法が未知であるシナリオで行われる可能性がある。
1つの変形は、一定の数のクロマアップサンプリング方法を行い、次いで、種々なアップサンプリング方法のための平均2乗誤差を最小化するY’値を選択することである。別のバージョンでは、Y’値は、最悪のケース、すなわち最大誤差が最小化されるように選択される。
別の変形は、Cb’およびCr’の2つ以上の近傍値を使用し、かつ、それらを直接的に使用して、可能なCb’およびCr’値の範囲を算出することである。
Y’の最良値を見つけるためのいくつかのやり方があり、これらのうちのいくつかを行うようにする。1つのやり方が図8に示されている。
最初に最適化対象の値Yを見つける必要がある。元の画素R、G、Bは、上記のようにRGBからXYZに変換される。これによって、X、Y、Zが生じ、この中ではYのみに関心がある。実際、XおよびZを算出する必要はない。このYは線形光における元の輝度であり、これは目に敏感なものである。テストケースでは、Yは573.5991に等しい(表1を参照)。
第2に、Cb’およびCr’値と共に既存のY’値を採り入れる。上のケースでは(422、607、812)を与えることになる(表2を参照)。ここで、Y’Cb’Cr’からR’G’B’への色変換を行うようにする。これは以下を使用して行われる。
R=Y’+1.47460×Cr’
G=Y’−0.16455×Cb’−0.57135×Cr’
B=Y’+1.88140×Cb’
次に、伝達関数を呼び出す。この場合、PQ−EOTFを使用し、これは、例えば、以下のMatlabコードを使用して実装できる。
関数L=pq_eotf(c)
%%%
%%%cは0,0〜1.0になる
%%%Lはニトによる出力輝度である
%%%
c1=0.8359375;
c2=18.8515625;
c3=18.6875;
n=0.1593017578125;
m=78.84375;
c=max(c、0);
c=mic(c、1);
L=10000((max(c.^(1/m)−c1、0)./(c2−c3c.^(1/m))).^(1/n));
その結果は、線形光における色(R、G、B)である。ここで、これを上記のようにXYZに転換する、または、実際には、Yを算出することだけが必要である。このYは画素の線形輝度であり、Yにできるだけ近づけさせたいのはこの輝度である。Yは1066.4311から始まる(表1を参照)。
ここで、YとYとを比較する。YがYより大きい場合、Y’値を422からより小さいものに縮小する。例えば、1つのステップを行って421を試みることができる。次いで、算出全体が再び行われて、新しいY値を生成する。これは再びYと比較され、これが依然大きすぎる場合、Y’をさらに小さくする。最終的に、363に到達し、結果としてのY値が生じ、すなわち、572.1852がここでYより小さくなる、すなわち、573.5991になる。プロセスはここで停止する。
上の実施形態では、422−363=59を繰り返し行って、最良値に到達する。これには費用がかかる場合がある。
したがって、一実施形態として、最良のY’値を見つけるために二分探索を行う。任意選択で、まず、最大Y’値、例えば1023を試みる。任意選択で、最小Y’値、例えば0を試みる。次いで、中間の値、例えば512を試みる。Y’=512から生じるY値がYより大きい場合、間隔[0、512]で探索するものとする。Y値がYより小さい場合、代わりに間隔[512、1023]を探索するものとする。次に進んで、選択された間隔の中ほどで新しい値を算出し、かつ、その間隔のみが[363、363]または「363、364」などの単一数を含有するまで進む。これは、log(N)ステップだけを取ることを保証し、この場合、Nは可能な値の数であり、この場合1024である。故に、log(1024)=10のステップで十分である。
最良値を算出する別のやり方は、最適化問題として図8を参照して、誤差E=(Y−YをY’に対して最小化することである。これは、Y’に対するEの勾配を算出すること、すなわち、dE/dY’による、勾配降下によって行うことができ、勾配の反対方向に少量Y’を更新すること、つまり、式中αは小定数として、Y’n+1=Y’−α×dE/dY’が可能である。
勾配降下は低速になり得るため、より迅速なやり方として、二階微分値dE/dY’を算出するまたは概算する二次最適化アルゴリズムを使用することが可能である。ガウス−ニュートンはかかるアルゴリズムの一例である。
別の実施形態では、Y’を算出するために以下のプロセスが適用される:
−X、Y、およびZはXYZ/RGB転換によって転換されて、新しい値R1、G1およびB1がもたらされる
−R1、G1、およびB1は逆伝達関数によって転換されて、R1’、G1’、およびB1’がもたらされる
−R1’、G1’、およびB1’は逆色変換によって転換されてY’がもたらされる
一実施形態では、ある画像またはピクチャにおける全ての画素のY’値は補正される。代替的な実施形態では、可視の輝度誤差を有する危険性がある画素のみが補正される。これは、色域の縁に近い画素を含むことができるが、色域三角形の中間により近い画素を除くことができる。
図9における最下行を見ると、処理の第1のステップは以下になる。
R’=Y’+1.47460×Cr’
G’=Y’−0.16455×Cb’−0.57135×Cr’
B’=Y’+1.88140×Cb’
しかしながら、Cr’およびCb’は固定され、補間されて、送られないため、Y’の右側の全てを定数に置き換えることができる。
R’=Y’+c1
G’=Y’+c2
B’=Y’+c3
次のステップとして、色成分の伝達関数を行う:
R=TF(R’)
G=TF(G’)
B=TF(B’)
これらは次いで以下になる
R=TF(Y’+c1)
G=TF(Y’+c2)
B=TF(Y’+c3)
処理の最後のステップはRGBからXYZまで行う。これは以下を使用して行われる。
X=0.636958×R+0.144617×G+0.168881×B
Y=0.262700×R+0.677998×G+0.059302×B
Z=0.000000×R+0.028073×G+1.060985×B
このうち、Y成分のみに関心があるため、以下を使用する。
Y=0.262700×R+0.677998×G+0.059302×B
先の式をこれに挿入すると、以下になる。
Y=0.262700×TF(Y’+c1)+0.677998×TF(Y’+c2)+0.059302×TF(Y’+c3)、または短くすると、
Y=f(Y’)になる。
この式の出力された値Yを元のYに適合させることが望まれる。非線形の形態では、Yは3つの異なる場所におけるY’に依存するため、Y’=f−1(Y)を捕えることができるように、関数を逆関数にする容易なやり方があるようには思われない。
しかしながら、非線形のTF(x)〜kx+mを線形にすることが可能である。3つの異なる場所でこれを行うと、
Y〜k1×Y’+m1+k2×Y’+m2+k3×Y’+m3になり、これは、
Y〜(k1+k2+k3)×Y’+(m1+m2+m3)と同等である。
これは、以下のような逆関数にすることができる。
Y’〜Y’k=(Y−(m1+m2+m3))/(k1+k2+k3)
よって、Y’kは前よりもYに近い値Ykを生じさせる可能性がある。関数はこの新しい点Y’kで再び線形にすることができ、これによって新しい値、Y’k+1などが生じる。
これらの反復技法全てについて、Y値に最も近いY値を生成する絶対的に最良の10ビット値を見つける必要はないことは留意されるべきである。反復法を数回または1回でも使用するだけで十分な場合がある。1回の反復から生じる補正されたY値は、全く補正されていないものよりもはるかに良好なものになる可能性が最も高くなる。
いくつかの線形化は前もって行われてもよい。上で指摘されるように、最悪の問題は、色域の縁上で生じる。故に、赤色原色を緑色原色に連結する線に対する1つの線形化、赤色原色を青色原色に連結する線に対する1つの線形化、および、緑色原色を青色原色に連結する線に対する1つの線形化を有することが可能である。別のやり方として、赤色原色に近い線形化、緑色原色に近い別の線形化、および青色原色に近い第3の線形化を使用させるようにすることができる。さらにまた、図9に示されるように、色域の線に沿っていくつかの線形化を有することができる。
よって、種々な領域において種々な線形化があるようにすることができる。色が実線による円の中にある場合、緑色原色に近くなり、1つの線形化を使用できる。赤色原色にさらに沿ってそれに向かって、すなわち破線ボックス内の場合、第2の線形化を使用できる。色域の縁、および、おおむね、赤色原色と緑色原色との中間、すなわち点線ボックス内部の場合、第3の線形化が使用可能である。赤色原色により一層近い、すなわち、実線によるボックス内部の場合、第4の線形化が使用可能である。点線の円内部にある、すなわち、赤色原色に近い場合、第4の線形化が使用可能である。三角形における他の2つの線の同じ仕切りも使用可能である。最終的に、三角形内部であるがボックスまたは円内ではない領域は、1つまたは複数の領域に区分されることが可能であり、各領域は異なる線形化を有する。
別のやり方は、ルックアップテーブル(LUT)を作成することである。上の公式化からわかるように、Cb’、Cr’、および望まれるY’値を有する場合、上記の反復技法のいずれかを使用して最良のY’を見つけることができる。故に、Cb’、Cr’、およびYの全ての可能な組み合わせについてルックアップテーブルを作成できる。例えば、Cb’およびCr’が10ビットに量子化されると仮定する。さらに、Yの10ビットへの量子化も仮定する。すると、ルックアップテーブルにおいて210×210×210の異なる値が必要とされる。それは、230の値と同等である。各値が2バイトである場合、これは、231バイト、すなわち2Gbを意味する。これは大きい値であるが、恐らくは、特に将来的に実行不可能ではない。
Yを量子化するときに慎重になる必要がある場合がある。Yが完全に線形であるためこれをただ量子化することは非効率的である場合がある。その代わりに、入力される変数として、Cb’、Cr’、およびYnonlinearを使用して、Ynonlinear=TF(Y)を作成し、かつ代わりにYのためのLUTを作成する方がより良い場合がある。Cb’、Cr’、Y’として、初めに、Ynonlinear=TF(Y)を算出後、Y’=LUT(Cb’、Cr’、Ynonlinear)を見つけるようにする。
また、より小さいLUTを使用することが可能である。例えば、Y(またはYnonlinear)、Cb’、およびCr’を、例えば6ビットに量子化可能とすることができる。次いで、テーブルサイズは、2(6+6+6)=218の値、または512kバイトに等しい219バイトとなる。これは現在のハードウェアでも合理的なサイズである。
真の値に最も近い量子化された値Cb’、Cr’、およびYを捕えて、それらを補間可能とすることができる。例として、Cb’の実際の値が6ビットに量子化されたCb’より大きいが、6ビット+1に量子化されたCb’より小さい場合、以下は良好な近似となる場合がある。
Y’=(LUT(Cb’6bit、Cr’6bit、Y6bit)+(LUT(Cb’6bit+1、Cr’6bit、Y6bit))/2
2つ以上の値の間での補間も可能である。
一実施形態では、ルックアップテーブルはY’の値を導出するために使用される。1つのバージョンでは、ルックアップテーブルは、Y、Cb’、およびCr’の全ての可能な値を含有する。これによって、10ビットのビデオに対して、1024×1024×1024のエントリが生じることになり、いくつかの応用例では、このサイズは受け入れ可能である。別のバージョンでは、ルックアップテーブル(LUT)は、例えば、Y、Cb’、およびCr’のうちの1つまたは複数を例えば8ビットに丸めることによって簡潔にされる。簡潔にされたルックアップテーブルが使用される場合、アルゴリズムは、LUTから検索されたY’から最良のY’を見つける改良ステップによって拡張可能である。あるバージョンでは、Cb’値および/またはCr’値によってY’がYとあまりにも異なってくる可能性があるとき、すなわち、最初に算出されたY’によってYとはあまりにも異なっている線形Y値が与えられるときだけにLUTが使用され、それによって、LUTのサイズは、Cb’およびCr’の多くの値がいずれの問題も引き起こさないため、実質的に低減可能である。
一実施形態では、Y、Cb’、およびCr’の関数、例えば、一次結合、多項式関数、指数関数、対数関数、三角関数などは、Y’を導出するために使用される。該関数は、Y、Cb’、およびCr’のいずれの値に対しても、YとYとの間の差異がある特定の閾値を下回る、または、導出されたY’と最適なY’との間の差異がある特定の閾値を下回るように規定できる。
一実施形態では、Y、Cb’、およびCr’のいくつかの異なる関数はY’を導出するために規定される。どの関数を使用するかについての選択は、Y、Cb’、およびCr’の値に基づく。
本明細書に説明される各実施形態について、Y’を導出するための方法が、Y’とTF(Y)との間の差異が開始するためのある特定の閾値を上回る場合にだけ呼び出される場合があり得る。
一態様によると、方法は、図10に示されるように提供される。方法は、エンコーダにおいて、またはエンコーダへの前処理において行われることが可能である。方法において、Cb’成分および/またはCr’成分が誤差を含むと決定されるとき、補正されたY’成分は、Cb’成分および/またはCr’成分における誤差を補償するために導出される。方法は、任意選択で、補正されたY’成分によってビデオを符号化することも含む。
実施形態の別の態様は、ピクチャ内の画素を前処理するためのデバイスに関する。デバイスは、第1の色空間における画素の線形色に基づいて決定される第3の色空間における画素の元の線形輝度成分値を得るように構成される。デバイスはまた、第2の色空間における第1の非線形クロマ成分値、第2の色空間における第2の非線形クロマ成分値、および、第3の色空間における元の線形輝度成分値に基づいて、画素の第2の色空間における非線形輝度成分値を導出するように構成される。
一実施形態では、デバイスは、第1の色空間における線形色に基づいて第3の色空間における元の線形輝度成分値を得るための決定するように構成される。
一実施形態では、デバイスは、第2の色空間における非線形輝度成分値、第2の色空間における第1の非線形クロマ成分値、および、第2の色空間における第2の非線形クロマ成分値に基づいて決定される、第3の色空間における元の線形輝度成分値と第3の色空間における線形輝度成分値との間の差異を最小化する第2の色空間における非線形輝度成分値を導出するように構成される。
一実施形態では、デバイスは、第2の色空間におけるサブサンプリングされた第1の非線形クロマ成分値、第2の色空間におけるサブサンプリングされた第2の非線形クロマ成分値、および、第3の色空間における元の線形輝度成分値に基づいて、第2の色空間における非線形輝度成分値を導出するように構成される。
一実施形態では、デバイスは、第1の色空間における非線形色を捕えるために第1の色空間における元の線形色に第1の伝達関数を適用するように構成される。デバイスはまた、第2の色空間における非線形色を捕えるために第1の色空間における非線形色に第1の色変換を適用するように構成される。第2の色空間における非線形色は、最初の第1の非線形クロマ成分値および最初の第2の非線形クロマ成分値を含む。デバイスは、第2の色空間におけるサブサンプリングされた第1の非線形クロマ成分値および第2の色空間におけるサブサンプリングされた第2の非線形クロマ成分値を捕えるために、第2の色空間における最初の第1の非線形クロマ成分値および第2の色空間における最初の第2の非線形クロマ成分値をサブサンプリングするようにさらに構成される。
一実施形態では、デバイスは、第2の色空間におけるアップサンプリングされた第1の非線形クロマ成分値および第2の色空間におけるアップサンプリングされた第2の非線形クロマ成分値を捕えるために、第2の色空間におけるサブサンプリングされた第1の非線形クロマ成分値および第2の色空間におけるサブサンプリングされた第2の非線形クロマ成分値をアップサンプリングするように構成される。デバイスはまた、第1の色空間における非線形色を捕えるために、第2の色空間における候補の非線形輝度成分値、第2の色空間におけるアップサンプリングされた第1の非線形クロマ成分値、および第2の色空間におけるアップサンプリングされた第2の非線形クロマ成分値に第2の色変換を適用するように構成される。デバイスは、第1の色空間における線形色を捕えるために第1の色空間における非線形色に第2の伝達関数を適用するようにさらに構成される。デバイスは、さらに、第3の色空間における線形輝度成分値を捕えるために第1の色空間における線形色に第3の色変換を適用するように構成される。デバイスはまた、第3の色空間における元の線形輝度成分値と第3の色空間における線形輝度成分値との比較に基づいて非線形輝度成分値を導出するように構成される。
一実施形態では、デバイスは、第3の色空間における元の線形輝度成分値と第3の色空間における線形輝度成分値との間の差異を低減する、例えば最小化する、第2の色空間における候補の非線形輝度成分値を選択するように構成される。
一実施形態では、デバイスは、第2の色空間における候補の非線形輝度成分値、第2の色空間におけるアップサンプリングされた第1の非線形クロマ成分値、および第2の色空間におけるアップサンプリングされた第2の非線形クロマ成分値への第2の色変換の適用と、第1の色空間における非線形色への第2の伝達関数の適用と、第2の色空間における種々な候補の非線形輝度成分値のための第1の色空間における線形色への第3の色変換の適用とを行うように構成される。デバイスはまた、第3の色空間における元の線形輝度成分値と第3の色空間における線形輝度成分値との間に最小の差異を生じさせる、第2の色空間における種々な候補の非線形輝度成分値の中から候補の非線形輝度成分値を選択するように構成される。
一実施形態では、デバイスは、第3の色空間における元の線形輝度成分値と第3の色空間における線形輝度成分値との間の差異を最小化する第2の色空間における候補の非線形輝度成分値を選択するために二分探索を行うように構成される。
一実施形態では、デバイスは、探索間隔の中ほどで、第2の色空間における候補の非線形輝度成分値、第2の色空間におけるアップサンプリングされた第1の非線形クロマ成分値、および第2の色空間におけるアップサンプリングされた第2の非線形クロマ成分値への第2の色変換の適用と、第1の色空間における非線形色への第2の伝達関数の適用と、第2の色空間における種々な候補の非線形輝度成分値のための第1の色空間における線形色への第3の色変換の適用とを行うように構成される。デバイスはまた、第3の色空間における元の線形輝度成分値と第3の色空間における線形輝度成分値との間の差異がゼロに等しい場合、探索間隔の中ほどで候補の非線形輝度成分値を選択するように構成される。デバイスはまた、その他の場合、第3の色空間における線形輝度成分値が第3の色空間における元の線形輝度成分値より大きい場合適用を行うときに、デバイスによって使用される候補の非線形輝度成分値で適用を行いかつ終了するときにデバイスによって使用される探索間隔と比較するとサイズが半分の探索間隔を選択するように、または、第3の色空間における線形輝度成分値が第3の色空間における元の線形輝度成分値より小さい場合適用を行うときに、デバイスによって使用される候補の非線形輝度成分値で適用を行いかつ開始するときにデバイスによって使用される探索間隔と比較するとサイズが半分の探索間隔を選択するように構成される。デバイスは、第3の色空間における元の線形輝度成分値と第3の色空間における線形輝度成分値との間の差異がゼロに等しくなる、または、探索間隔が第2の色空間における単一の候補の非線形輝度成分値を含むまで、探索間隔の適用および選択を行うことを繰り返すようにさらに構成される。
一実施形態では、デバイスは、第2の色空間におけるアップサンプリングされた第1の非線形クロマ成分値、および第2の色空間におけるアップサンプリングされた第2の非線形クロマ成分値を捕えるために、第2の色空間におけるサブサンプリングされた第1の非線形クロマ成分値、および第2の色空間におけるサブサンプリングされた第2の非線形クロマ成分値をアップサンプリングするように構成される。デバイスはまた、ルックアップテーブルへの入力として、第3の色空間における元の非線形輝度成分値、またはこの非線形バージョン、第2の色空間におけるアップサンプリングされた第1の非線形クロマ成分値、および第2の色空間におけるアップサンプリングされた第2の非線形クロマ成分値、またはこの量子化バージョンを使用して、ルックアップテーブルから第2の色空間における非線形輝度成分値を検索するように構成される。
一実施形態では、デバイスは、第3の色空間における元の非線形輝度成分値を捕えるために第3の色空間における元の線形輝度成分値に第1の伝達関数を適用するように構成される。デバイスは、ルックアップテーブルへの入力として、第3の色空間における元の非線形輝度成分値、第2の色空間におけるアップサンプリングされた第1の非線形クロマ成分値、および第2の色空間におけるアップサンプリングされた第2の非線形クロマ成分値、またはこの量子化バージョンを使用して、ルックアップテーブルから第2の色空間における非線形輝度成分値を検索するように構成される。
図11は、一実施形態による、ピクチャを前処理するためのデバイス100の特定のハードウェア実装形態を概略的に示す。一実施形態では、デバイス100は、第3の色空間における元の線形輝度成分値を得るように構成される決定部101を含む。デバイス100はまた、画素の第2の色空間における非線形輝度成分値を導出するように構成される導出部102を含む。
別の実施形態では、デバイス100は、Cb’および/またはCr’が誤差を含むかを決定するように構成される決定部101を含む。デバイス100はまた、補正されたY’を導出するように構成される導出部102を含む。デバイス100は、補正されたY’でピクチャを符号化するように構成されるビデオエンコーダ103をさらに含む。
一実施形態では、デバイス100はまた、符号化されるべきビデオを検索するように興亜精される入力部104と、符号化されたビットストリームを出力するように構成される出力部105とを含む。
入力部104は、特に、外部デバイスへの有線接続の場合、一般的な入力部の形態とすることができる。代替的には、入力部104は、特に、外部デバイスへの無線接続の場合、受信機またはトランシーバの形態とすることができる。それに応じて、出力部105は、特に、外部デバイスへの有線接続の場合、一般的な出力部の形態とすることができる。代替的には、出力部105は、特に、外部デバイスへの無線接続の場合、送信機またはトランシーバの形態とすることができる。
入力部104は、好ましくは、決定部101、導出部102、およびビデオエンコーダ103に接続されて、符号化されるべきビデオをこれらに送付する。決定部101は、好ましくは、導出部102およびビデオエンコーダ103に接続される。ビデオエンコーダ103は、好ましくは、出力部105に接続されて、符号化されたビットストリームを例えばデコーダに送付する。
適したハードウェア回路構成の特定の例は、1つまたは複数の適当に構成された、または場合によっては再構成可能な電子回路構成、例えば、特定用途向け集積回路(ASIC)、フィールドプログラマブルゲートアレイ(FPGA)、または適したレジスタ(REG)および/またはメモリ部(MEM)と接続した専門機能を果たすように相互接続された離散論理ゲートおよび/またはフリップフロップに基づいた回路などの任意の他のハードウェア論理を含む。
代替的には、本明細書に説明されるステップ、関数、手順、モジュール、および/またはブロックの少なくともいくつかは、1つまたは複数のプロセッサもしくは処理部などの適した処理回路構成によって実行するためにコンピュータプログラムなどのソフトウェアに実装されてよい。
処理回路構成の例は、1つまたは複数のマイクロプロセッサ、1つまたは複数のデジタル信号プロセッサ(DSP)、1つまたは複数の中央処理装置(CPU)、ビデオアクセラレーションハードウェア、および/または、1つもしくは複数のFPGA、または1つもしくは複数のプログラマブルロジックコントローラ(PLC)などの任意の適したプログラマブル論理回路構成を含むが、これらに限定されない。
提案された技術が実装される任意の従来のデバイスまたはユニットの一般的な処理機能を再利用することを可能とすることができることも理解されるべきである。また、例えば、既存のソフトウェアの再プログラミングによって、または新しいソフトウェア構成要素を追加することによって、既存のソフトウェアを再利用可能とすることができる。
特定の例では、デバイス110(図12を参照)は、プロセッサ111、および、プロセッサ111によって実行可能な命令を含むメモリ112を備える。一実施形態では、プロセッサ111は第3の色空間における画素の元の線形輝度成分値を得るように動作可能である。プロセッサ111はまた、画素の第2の色空間における非線形輝度成分値を導出するように動作可能である。
別の実施形態では、プロセッサ111は、Cb’および/またはCr’成分が誤差を含むか、かつ、Cb’および/またはCr’成分が誤差を含むかはいつ決定されるかを決定するように動作可能である。プロセッサ111はまた、Cb’および/またはCr’成分における誤差を補償するために補正されたY’成分を導出するように動作可能である。
一実施形態では、デバイス110はまた、符号化されるべきビデオを受信するように構成される入力部113を含む。このような場合、プロセッサ111は入力部113から符号化されるべきビデオを受信するように動作可能である。
一実施形態では、デバイス110はまた、プロセッサ111から受信されるような符号化されたビットストリームを出力するように構成される出力部114を含む。
特定の実施形態では、プロセッサ111は、上述される動作を行うためにメモリ112に記憶された命令を実行するとき、動作可能である。そのため、プロセッサ111は、通常のソフトウェアによる実行を可能にするためにメモリ112に相互接続される。
図13は、プロセッサ210、関連付けられたメモリ220、および通信回路構成230を含むユーザ機器(UE)200の一例を示す概略ブロック図である。
この特定の例では、本明細書に説明されるステップ、関数、手順、モジュール、および/またはブロックの少なくともいくつかは、コンピュータプログラム240に実装され、このコンピュータプログラム240は、1つまたは複数のプロセッサ210を含む処理回路構成による実行のためにメモリ220にロードされる。プロセッサ210およびメモリ220は、通常のソフトウェアによる実行を可能にするために互いに相互接続される。通信回路構成230も、ビデオデータの入力および/または出力を可能にするためにプロセッサ210および/またはメモリ220に相互接続される。
ユーザ機器200は、ビデオデータを受信しかつ処理することができる任意のデバイスまたは装置とすることができる。例えば、ユーザ機器200は、ラップトップ、スマートフォン、タブレット、セットトップボックス、ビデオカメラといった、固定型または携帯型のどちらのコンピュータとすることができる。
「プロセッサ」という用語は、特定の処理、決定、またはコンピューティングタスクを行うためのプログラムコードまたはコンピュータプログラム命令を実行可能である任意のシステムまたはデバイスとしての一般的な意味で解釈されるべきである。
よって、1つまたは複数のプロセッサを含む処理回路構成は、コンピュータプログラムを実行するとき、本明細書に説明されるものなどの明確に定義された処理タスクを行うように構成される。
処理回路構成は、上述されるステップ、関数、手順、および/またはブロックのみを実行する専用のものとする必要はなく、他のタスクも実行してよい、
一実施形態では、コンピュータプログラム240は、プロセッサ210によって実行されたとき、プロセッサ210に、第1の色空間における画素の線形色に基づいて決定される第3の色空間におけるピクチャの画素の元の線形輝度成分値を得させる命令を含む。プロセッサ210にはまた、第2の色空間における第1の非線形クロマ成分値、第2の色空間における第2の非線形クロマ成分値、および、第3の色空間における元の線形輝度成分値に基づいて、画素の第2の色空間における非線形輝度成分値を導出させる。
一実施形態では、コンピュータプログラム240は、プロセッサ210によって実行されたとき、プロセッサ210に、非線形輝度成分値、第1の非線形クロマ成分値、および第2の非線形クロマ成分値を符号化させる命令をさらに含む。
別の実施形態では、コンピュータプログラム240は、プロセッサ210によって実行されたとき、プロセッサ210に、Cb’およびCr’成分が誤差を含むかを決定させ、Cb’および/またはCr’成分が誤差を含むと決定されたとき、プロセッサ210に、Cb’および/またはCr’成分における誤差を補償するために、補正されたY’成分を導出させる命令を含む。
提案された技術はまた、コンピュータプログラム240を含むキャリア250を提供する。キャリア250は、電子信号、光信号、電磁信号、磁気信号、電気信号、無線信号、マイクロ波信号、または、コンピュータ可読記憶媒体250のうちの1つである。
例として、ソフトウェアまたはコンピュータプログラム240は、通常は、コンピュータ可読媒体240、好ましくは、不揮発性コンピュータ可読記憶媒体250上に保持されるまたは記憶されるコンピュータプログラム製品として実現されてよい。コンピュータ可読媒体250は、読み取り専用メモリ(ROM)、ランダムアクセスメモリ(RAM)、コンパクトディスク(CD)、デジタル多用途ディスク(DVD)、ブルーレイディスク、ユニバーサルシリアルバス(USB)メモリ、ハードディスクドライブ(HDD)記憶デバイス、フラッシュメモリ、磁気テープ、または、任意の他の従来のメモリデバイスを含むがこれらに限定されない、1つまたは複数の取り外し可能なまたは取り外し不可能なメモリデバイスを含むことができる。よって、コンピュータプログラム240は、図19におけるユーザ機器200によって表される、コンピュータまたは同等の処理デバイスのオペレーティングメモリに、このプロセッサ210による実行のためにロードされてよい。
実施形態のさらなる態様は、ピクチャ内の画素の符号化バージョンを表す信号にも関する。符号化バージョンは、第2の色フォーマットにおけるサブサンプリングされた第1の非線形クロマ成分値の符号化バージョンと、第2の色フォーマットにおけるサブサンプリングされた第2の非線形クロマ成分値と、実施形態のいずれかに従って導出された、第2の色フォーマットにおける非線形輝度成分値の符号化バージョンとを含む。
一実施形態では、信号は、電子信号、光信号、電磁信号、磁気信号、電気信号、無線信号、およびマイクロ波信号のうちの1つである。
したがって、本明細書に提示されるフロー図または図表は、1つまたは複数のプロセッサによって行われるときの、コンピュータフロー図または図表と見なされてよい。対応するデバイスは、関数モジュールのグループとして規定されてよい。この場合、プロセッサによって行われる各ステップは関数モジュールに対応する。この場合、関数モジュールは、プロセッサ上で起動しているコンピュータプログラムとして実装される。故に、デバイスは、代替的には、関数モジュールのグループとして規定されてよく、この場合、関数モジュールは、少なくとも1つのプロセッサ上で起動しているコンピュータプログラムとして実装される。
よって、メモリに常駐するコンピュータプログラムは、プロセッサによって実行されたとき、本明細者に説明されるステップおよび/またはタスクの少なくとも一部を行うように構成される適切な関数モジュールとして組織化可能である。このような関数モジュールの一例は図14に示されている。
図14は、関数モジュールによってピクチャ内の画素を前処理するためのデバイス120の概略ブロック図である。一実施形態では、デバイス120は、第1の色空間における画素の線形色に基づいて決定される第3の色空間における画素の元の線形輝度成分値を得るための決定部121を含む。デバイス120はまた、第2の色空間における第1の非線形クロマ成分値、第2の色空間における第2の非線形クロマ成分値、および、第3の色空間における元の線形輝度成分値に基づいて、画素の第2の色空間における非線形輝度成分値を導出するための導出部122を含む。
別の実施形態では、デバイス120は、Cb’および/またはCr’が誤差を含むかを決定するための決定部121を含む。デバイス120はまた、補正されたY’を導出するための導出部102を含む。デバイス120は、補正されたY’を使用してビットストリームを符号化するためのビデオエンコーダ123をさらに任意選択で備える。
実施形態のさらなる態様(図12を参照)は、ピクチャ内の画素を符号化するためのデバイス110に関する。デバイス110は、プロセッサ111と、プロセッサ111によって実行可能な命令を含むメモリ112とを含む。プロセッサ111は、第1の色空間における画素の線形色に基づいて決定される第3の色空間における画素の元の線形輝度成分値を得るように動作可能である。プロセッサ111はまた、第2の色空間における第1の非線形クロマ成分値、第2の色空間における第2の非線形クロマ成分値、および、第3の色空間における元の線形輝度成分値に基づいて、画素の第2の色空間における非線形輝度成分値を導出するように動作可能である。プロセッサ111は、非線形輝度成分値、第1の非線形クロマ成分値、および、第2の非線形クロマ成分値を符号化するようにさらに動作可能である。
実施形態の別のさらなる態様(図14を参照)は、ピクチャ内の画素を符号化するためのデバイス120に関する。デバイス120は、第1の色空間における画素の線形色に基づいて決定される第3の色空間における画素の元の線形輝度成分値を得るための決定部121を含む。デバイス120はまた、第2の色空間における第1の非線形クロマ成分値、第2の色空間における第2の非線形クロマ成分値、および、第3の色空間における元の線形輝度成分値に基づいて、画素の第2の色空間における非線形輝度成分値を導出するための導出部122を含む。デバイス120は、非線形輝度成分値、第1の非線形クロマ成分値、および、第2の非線形クロマ成分値を符号化するためのエンコーダ123をさらに含む。
一態様によると、プリプロセッサまたはエンコーダなどのユニットが提供される。ユニットは、Cb’および/またはCr’成分が誤差を含むかを決定するように構成され、Cb’および/またはCr’成分が誤差を含むと決定されたとき、該ユニットは、Cb’およびCr’成分における誤差を補償するために、補正されたY’成分を導出するように構成される。
本実施形態はまた、実施形態による、画素を前処理するためのデバイス、または画素を符号化するためのデバイスを含むユーザ機器に関する。ユーザ機器は、好ましくは、ビデオデータを受信しかつ処理するように構成されるデバイスまたは装置である。ユーザ機器は、例えば、HDMIなどのインターフェース上でビデオデータを送付するように構成されるデバイスまたは装置とすることができる。
別の実施形態は、実施形態による、画素を前処理するためのデバイス、または画素を符号化するためのデバイスを含むユーザ機器に関する。この実施形態では、ユーザ機器は、コンピュータ、ラップトップ、スマートフォン、タブレット、およびセットトップボックスから成るグループから選択されるのが好ましい。
ネットワーク上での遠隔地へのサービスなどのリソースがもたらされる、ネットワークノードおよび/またはサーバなどのネットワークデバイスにおけるハードウェアおよび/またはソフトウェアなどのコンピューティングサービスを提供することがますます普及してきている。例として、これは、機能が、本明細書に説明されるように、1つまたは複数の別個の物理ノードもしくはサーバに分散または再配置可能であることを意味する。機能は、別個の物理ノードに、すなわち、いわゆるクラウドに位置付け可能である1つまたは複数の共同で作動する物理および/または仮想マシンに再配置または分散されてよい。これは時にクラウドコンピューティングとも呼ばれ、ネットワーク、サーバ、記憶域、アプリケーション、および、一般サービスまたはカスタマイズされたサービスなどの構成可能なコンピューティングリソースのプールへのユビキタスオンデマンドネットワークアクセスを可能にするモデルである。
図15は、機能が、一般的なケースにおける、異なるネットワークデバイス300、301、302の間でどのように分散または区分可能であるかの一例を示す概略図である。この例では、少なくとも2つの個別ではあるが相互接続されたネットワークデバイス300、301があり、これらは、ネットワークデバイス300、301の間で区分される、異なる機能、または同じ機能の一部を有することができる。このような分散実装形態の一部である追加のネットワークデバイス302があってよい。ネットワークデバイス300、301、302は、同じワイヤレス通信システムの一部であってよく、または、ネットワークデバイスの1つまたは複数は、ワイヤレス通信システムの外部に位置するいわゆるクラウドベースのネットワークデバイスであってよい。
図16は、1つまたは複数のクラウドベースのネットワークデバイス300と協働する、アクセスネットワーク1および/またはコアネットワーク2および/または運用支援システム(OSS)3を含む、ワイヤレス通信システムの一例を示す概略図である。図はまた、実施形態による、アクセスネットワーク1のネットワークノード4、およびユーザ機器5も示す。
実施例
近年、解像度を高めて標準精細から高精細によって4kにすることによって、デジタルビデオにおいて途方もない品質の向上が達成されている。ハイダイナミックレンジ(HDR)ビデオは、要するに、コントラストを高めることによって、感知される画像品質を高めるための別のやり方を使用する。従来のテレビシステムは、1平方メートル当たり0.1カンデラ(cd/m)〜100cd/mの輝度、すなわち約10倍増の輝度に対して構築されたもので、これは、一般的に、標準的なダイナミックレンジ(SDR)ビデオと呼ばれる。比較すると、いくつかのHDRモニタは、0.01〜4000cd/m、すなわち、18倍増を上回って表示可能である。
従来のSDR処理
テレビまたはコンピュータモニタなどの典型的なSDRシステムは、0が暗さをかつ255が明るさを表す、8ビット表現を使用することが多い。上記の、コード値範囲[0;255]から輝度範囲[0.1;100]cd/mへただ線形にスケーリングすることは理想的ではないことになる。最初の2つのコード語の0および1は、それぞれ、0.1cd/mおよび0.49cd/mにマッピングされることになり、相対的差異は390%になる。一方、最後の2つのコード語の254および255は、それぞれ、99.61cd/mおよび100cd/mにマッピングされることになり、相対的差異は0.3%のみになる。相対的なステップサイズにおけるこの大きい差異を回避するために、SDRシステムは、非線形的にコード値を輝度にマッピングする電気光学伝達関数(EOTF)を含む。例として、赤成分は最初に、255で除算されて値R01∈[0;1]を得た後、べき関数R’=(R01γによって与えられる。
最終的に、R’は、[0.1;100]の範囲にスケーリングされて、cd/mの光表現を捕える。緑成分および青成分は同じように扱われる。γ=2.4を選択することによって、第1の2つのコード語の間の相対的差異は0.16%になり、最後の2つのコードの間の相対的差異は0.95%になり、これはさらに一層バランスがとられている。
SDR取得プロセス
カメラセンサが線形光(R、G、B)をcd/mで測定すると仮定し、第1のステップは、正規化線形光(R01、G01、B01)にたどり着くためにピークの明るさで除算することである。次いで、EOTFの逆関数はR’(R011/γが適用され、同様に、緑および青に対して行われる。色成分の相関を失わせるために、RGB色空間からYCbCrへの色変換が適用される。次のステップは、データを量子化することである。この例では、10ビットに量子化して、0から1023まで変化する成分(Y’444、Cb’444、Cr’444)を生じさせる。最終的に、2つのクロマ成分は、(Y’420、Cb’420、Cr’420)を捕えるためにサブサンプリングされる。データはここで、HEVCエンコーダなどのビデオエンコーダに送られることが可能である。
SDRデータの表示、
受信側では、HEVCビットストリームは(Y’420、Cb’420、Cr’420)または、むしろ、HEVCが損失の多いデコーダであることによる、これらの値の復号化バージョンを回復するように復号される。次いで、信号は、上述されるものとは逆に処理される。最終結果として線形光表現(R、G、B)がもたらされ、これは表示される。
HDR処理
10,000cd/mの輝度を含むことができるHDRデータについて、単純なべき関数は、輝度の全範囲にわたって人間の目のコントラス感度に合致しない。γの任意の固定値は、原色調、明るい色調、または中間調のいずれかの粗すぎる量子化をもたらすことになる。この問題を解決するために、下記のように規定されるEOTFが使用される。
ピーク輝度はまた、100から10000まで変更される。
問題
上で概説される従来のSDR処理を適用するが上で規定される新しいEOTFを共に適用し、ピーク輝度が10,000に等しい場合、予想外のことが生じる。図17A、図17B、図18A、および図18Bを比較することによって示されるように、アーティファクトが現れる。図17A、図17B、図18A、図18Bについて、サブサンプリングおよび10ビットへの量子化以外の圧縮は行われていないことに留意されたい。さらにまた、アーティファクトの妨害が生じる。
分析
以下の2つの画素がピクチャにおいて隣り合わせであると仮定する。
RGB1=(1000;0;100);、および
RGB2=(1000;4;100)
これらの色がかなり類似していることに留意されたい。しかしながら、第1の処理ステップは、
Y’444Cb’444Cr’4441=(263;646;831)および
Y’444Cb’444Cr’4442=(401;571;735)
を生じさせ、これらは互いにかなり異なっている。これらの2つの値の平均は、Y’CbCr’=(332;608.5;783)である。ここで、処理の連鎖で後退して、これが表すのは何の線形RGB値なのかを見る場合、RGB=(1001;0.48;100.5)を捕え、これは、RGB1およびRGB2両方にかなり近い。よって、3つの成分全てをただ平均化することは問題ではない。Cb’およびCr’のみが補間されるときにより大きな問題が生じ、補間なしで画素からY’値を使用する。これは、従来のクロマサブサンプリングで行われることであり、4:2:0表現をもたらすために行われる。例えば、Y’を上の第1の画素を取り出すこと、すなわち、Y’Cb’Cr’=(263;608.5;783)は(484;0.03;45)の線形RGB色を表し、この色は暗すぎる。同様に、Y’を第2の画素から取り出すこと、すなわち、Y’Cb’Cr’=(401;608.5;783)は、(2061;2.2;216)のRGB値を与え、この値は明るすぎる。
可能な回避策
第3の画素を該例に追加することを検討すると、
RGB3=(1000;8;100)
これらの線形入力をR’G’B’に転換する場合、以下が得られる。
R’G’B’1=(0.7518;0.0000;0.5081)
R’G’B’2=(0.7518;0.2324;0.5081)
R’G’B’3=(0.7518;0.2824;0.5081)
明確には、G’での飛越は、第1の画素と第2の画素との間ではより大きいが、線形Gは4の等しいステップで変更する。同様に、Y’Cb’Cr’座標間の差異は、最後の2つよりも最初の2つの画素間の方がより大きくなる。故に、この影響は、成分のうちの1つまたは2つが線形光においてゼロに近いときに、すなわち、色が色域の縁に近いときに、最も大きくなる。よって、アーティファクトを回避する1つのやり方は、ただ飽和色の回避を行うことで可能である。しかしながら、BT.2020のより大きい色空間は、具体的には、より飽和された色に対して可能にするために導入されたため、解決策は所望されない。
これは別の問題点を強調する。多くのテストコンテンツがRec.709で撮られて、BT.2020への転換後、色はどれも十分に飽和されなくなるため、アーティファクトは小さくなる。例として、Rec.709で取得される画素、例えば、RGB709=(0;500;0)は、BT.2020への転換後、もはやいずれのゼロ成分もなく、RGB2020=(165;460;44)になる。後に、カメラがBT.2020で録画できるとき、はるかに強力なアーティファクトが出現することになる。BT.2020コンテナにおけるBT.2020の効果をエミュレートするために、この例における図の処理のために、結果としてRec.709コンテナにおいてRec.709の材料を使用している。しかしながら、数学的に、座標R010101は、両方の場合、[0;1]の全範囲にわたることになるため、差異はない。
別の回避策は、一定の輝度処理(CL)を使用することである。非一定輝度処理(NCL)と呼ばれる上で提示された処理において輝度Y’において保持される輝度の大部分のみと対照的に、CLでは、輝度の全てはY’において保持される。しかしながら、CLによる1つの問題は、連鎖全体に影響を及ぼすことであり、つまり、4:2:0/4:2:2のCL表現と4:2:0/4:2:2のNCL表現との間の前後の転換は、全ての転換ステップにおいてアーティファクトの導入を危険にさらす。実際には、結果として、従来のNCLからCLへの産業全体の転換は困難になっている。
提案される解決策:輝度調節
基本的な着想は、生じる輝度が所望の輝度に適合するかを確認することである。輝度では、(線形)CIE1931 XYZ色空間のY成分を意味する。このYは、上記の輝度Y’とは異なるが、これは、Y=wR+wG+wB(1)のように、Yが線形RGB値から算出されるからである。式中、w=0.2627、w=0.6780、およびw=0.0593である。輝度Yは、人間の視覚系がどのように明るさを認識するかにうまく対応するため、その輝度を良好に保存することは興味深い。これは図19に示され、ここで、処理された信号(上部)および元の信号(下部)の両方は線形XYZに転換される。次いで、Y成分は図に見られるようにかなり異なっている。重要な洞察としては、輝度値Y’が各画素において独立して変更できるため、図20に示されるように、
がYに等しくなるまでY’を変更することによって所望されたまたは元の正しい線形輝度Yに想到することができることである。また、
がY’で単調に増加する場合があり、これは、Y’が変更されるべきである方向を知ることが可能であることを意味する。したがって、間隔の半減などの単純な方法を使用して、10ビット量子化に対するたかだか10のステップにおいて最適なY’を見つけることができる。ワンステップ解決策が好ましい場合、Cb、Cr、および所望される線形輝度Yにおいて採用し、かつY’をもたらす3Dルックアップテーブルを使用することができる。
実装の態様
技法は以下のやり方で効率的に実装可能である。最初に、各画素の所望されるまたは元の輝度Yは、各画素の元の(R、G、B)の値に式1を適用することによって得られる。第2に、連鎖全体:(R、G、B)→(正規化)→(R01、G01、B01)→(EOTF−1)→(R’G’B’)→(色変換)→(Y’01、Cb’0.5、Cr’0.5)→(10−ビット量子化)→(Y’444、Cb’444、Cr’444)→(クロマサブサンプリング)→(Y’420、Cb’420、Cr’420)→(クロマアップサンプリング)→
→(逆量子化)→
が実行される。次いで、各画素について、[0;1023]の開始間隔が設定される。次に、候補値
=512を試みる。
は候補値から、かつ先に算出された
を使用して算出され、
→(逆色変換)→
→(EOTF)→
→(非正規化)→
の連鎖を通して
を生じさせる最後の処理ステップを行うことができる。これはここで、式1に与えられて、候補輝度
を得る。所与の画素について、
ならば、これは、候補値
が小さすぎたこと、かつ、正しい輝度値が間隔[512;1023]になければならないことを意味する。同様に、
ならば、正しい輝度値は間隔[0;512]になければならない。ここでプロセスは繰り返され、10回の反復後、間隔は2つの近傍値を含有する。この段階で、2つの値の両方を試み、最小の誤差
をもたらす1つが選択される。
結果
従来の処理の連鎖を実施し、かつこれを、輝度調節ステップを含むがデコーダを同じままにした本発明の連鎖と比較した。図17A〜図17C、および図18A〜図18Cは、圧縮なしの結果を示す。ここで、従来の処理の連鎖(図17Bおよび図18B)および本発明の処理の連鎖(図17Cおよび図18C)の両方は、Y’Cb’Cr’4:2:0に転換し、その後線形RGBに戻る。図17Aおよび図18Bは元のピクチャを示す。全符号化時間(色転換+HM圧縮)は従来の処理と比較すると約3%増加する。
HDRの材料について、1つのメトリックがSDRコンテンツに対するPSNRと同様の役割を果たすことはない。むしろ、輝度に対するtPSNR−Yおよびクロミナンスに対するdeltaEの2つのメトリックが報告される。表5では、BT.709コンテナにおけるBT.709の材料の非圧縮結果が示される。ここで、平均で17dBを上回る、かつ1つのシーケンスで20dBを上回る、tPSNR−Yとして測定される輝度品質の大きな増加が見られる。また、deltaE結果が改善している。表6は、BT.2020コンテナにおけるBT.709の材料またはP3の材料の非圧縮結果を示す。ここで、ゲインはあまり明白ではないが、これは、直接的に色域の縁上の色が利用可能でないからであるが、tPSNR−Yの改善は、依然平均で8dBであり、いくつかのシーケンスでは11dBを上回る。deltaE測定値はわずかに改善している。BT.2020の材料では、ゲインが表5におけるゲインとさらに類似することが考えられることに留意されたい。
付録
この付録では、4:2:0のサブサンプリングによる色のアーティファクトを究明する。最初に、照合が試みられるが、最悪の値は再生できず、これは、既に固定されているHDRToolsにおけるバグによる可能性がある。次に、4:2:0のサブサンプリングから生じる、輝度の最悪の相対誤差についての探索が行われる。4000ニトに限定されるスクリーン上で表示される場合でも、86%の相対誤差(195のBartenステップ)が生じ得ることがわかる。データがRec709に制限され、かつBT.2020コンテナにおいて保有されている場合でも、30のBartenステップの誤差が生じる可能性がある。BT.2020コンテナにおけるP3コンテンツについて、40のBartenステップの誤差が生じ得る。
1.概論
圧縮が発生しない場合でも、4:2:0のサブサンプリングが使用されるとき、色の小さな変更が驚くほど大きなアーティファクトを導入する可能性があることが記されている。
1.1 照合不一致
この究明は、m35255[1]の照合で開始し、以下の表A1に転写される、スライド13上の結果を再現することを試みる。その結果はテスト画像から生じ、ここで画素95に至るまでの画像の左部分は色(3000、0、100)を有し、画素96に至るまでの画像の右部分および前方は色(3000、4、100)を有する。
アンカー(n14548、International Organization for Standardization、ISO/IEC JTC1/SC29/WG11、Coding of moving pictures and audio、MPEG2014/N14548、2014年7月、札幌、日本のLuthraらの「Test sequences and anchor generation for HDR and Wide Gamut Content Distribution」[2])についてと同じ手順を使用した照合時に、表A2に示される結果が得られる。ダウンサンプリングについて、[2]のセクション2.4.7に記載されるフィルタが採り入れられ(2および3タップ)、アップサンプリングについて、[2]のセクション2.4.8に記載されるフィルタが採り入れられる(フィルタを4タップ)。
見られるように、この適合は実に不十分であり、画素番号94および98のみが適合するのに対し、画素番号95〜97、または99については適合が見出されない。しかしながら、この不連続点を代わりに画素97に移動させることで、表A3に示されるように、はるかに良好に適合する。
表A3において、画素番号96のみが適合しない。これはまた、最も奇妙な値(10000、1.57、402.25)の画素であり、正しい解答は(3000、0、100)または(3000、4、100)であり、これは不連続点を入れた場所に左右される。
照合における不適合は、HDRtoolsにおいて既に補正されている誤差によるものであるかのように思われる。改訂492に戻る場合、m35255[1]と同じ値がもたらされる可能性がある。HDRtoolsのより新しいバージョン(改訂573)が正しいことを確認するために、Matlabにおける処理の連鎖が独立して実施されており、表A3と同じ結果が得られる。不連続点を適合のために移動しなければならなかった理由は、現在のバージョンに固定されている改訂492における間違ったフィルタリングによる恐れがある。
1.2 丸めの問題点
Matlab照合を実施するとき、HDRtoolsにおけるEXRへの浮動の転換は丸めが欠如している。仮数の23ビットを10ビットへ丸める代わりに、単に右にシフトさせて、基本的に丸め()をフロア()に置き換える。これは最終結果に影響を及ぼす。例として、3008.0がはるかに近い値であっても、3007.9の浮動は3006.0に転換されることになる。適合させるために、Matlabコードによって、HDRtoolsの現在のバージョンにおけるフロア()タイプの転換をエミュレートする(https://wg11.sc29.org/svn/repos/Explorations/XYZ/HDRTools/branches/0.9−dev[3]の改訂587)。
1.3 色の外れ値
画素96がもはや極端な外れ値でない場合でも、画素97は依然、(3000、4、100)ではなく正しい(5860、2.58、199)からは程遠い。これに対して、4:2:0のサブサンプリングが生成するのはどれほど悪い外れ値の可能性があるか、かつこれはどこで発生するのかに関する疑問点が生じる。この疑問点に解答するために、最初に「悪い」が何を意味するのかを規定する必要がある。人間の視覚系はクロミナンスより輝度の変化により敏感であるため、輝度に集中させた。故に、入力されたEXR画像および出力されたEXR画像両方の線形光両方をXYZに変換させ、かつ、Yの差異を形成した。相対誤差を捕えるために、次いで、元の成分のY成分で除算した。次いで、画素97に対するこの相対誤差を、正にm35255[1]で行われたように、左部分が1つの色であり、右部分が同じ色であり、加えて、小さいデルタが長さ4であるタイプの全ての可能な画像にわたって最大化するように小プログラムを書き込んだ。
このプログラムを起動することによって、表A4に示されるように、左部分における色(2142、0、138)および右部分における色(2142、4、138)を有することで、最大の可視誤差が生じるという解答が得られた。「最悪」の誤差を探す最適化ソフトウェアは最大値を見つけることは保証していないため、色域におけるさらに悪い位置が存在する場合がある。
2142より高い赤成分を有することはより大きい相対誤差も生成することになることは留意されるべきである。しかしながら、4000を上回るRGB値はモニタによって4000にクリッピングされると仮定したため、実際の画面上の差異はより高い値が使用されたとしたら減少し始めることになると考えられる。
表A4に見られるように、RGB4:4:4の相対誤差は0.0304%である。これを全体的に見るために、コントラスト感度に対するBarten曲線を示す図21に見られるように、これとBarten曲線とを比較した。曲線より下のコントラストははっきりしない。表A5は曲線を図21にプロットするために使用される値を示す。
図21に見られるように、相対誤差の許容範囲は輝度が増すにつれ減少する。100ニトで、0.44%の誤差がただ目につくことになる可能性があるのに対し、1000ニトで、0.40%の誤差がただ目につくことになる可能性がある。これらのちょうど間に455ニトあるため、0.44%のより高い値が使用される。これによって0.069のBartenステップが示され、これははっきりしないことを意味する。
一方、4:2:0のサブサンプリングについて、相対誤差は85.92%である。これは、195を超えるBartenステップと同等であるため、明確に可視になるはずである。したがって、4:2:0のサブサンプリングが、アンカー生成時の場合のように、少なくとも、非一定輝度および非常に非線形の伝達関数と共に、明確に可視のアーティファクトをもたらす可能性があると結論付けることは妥当であると思われる。
緑色がゼロであり、色(2142、0、138)が赤色原色と緑色原色との間の線上にあるため、最悪の誤差は正に色域の境界上にあることに留意されたい。これは、m35255[1]において報告されたことと一致しており、また、これによって、色域の縁上の色は問題があるとして指摘されている。
1.4 入力が709のデータであるとき
表A1に提示されるデータは、BT.2020原色についてであった。入力データがRec709原色によるものであるがコンテナがBT.2020である場合、色域境界線に到達することは不可能となる。これは、図22に見られるように、Rec709色域三角形が色域境界線に触れずにBT.2020三角形内部にあることによる。したがって、相対誤差がより小さくなると仮定することは妥当である。
BT.2020の転換後に最大の相対誤差を生じさせることになるRec709色を見つけるための最適化ソフトウェアを起動させる。結果として生じる2つの色は、スクリーンの左部分が(0、0、50)で右部分が(2、3、49)である。これは表A6に提示されている。
ここでは、10ニトでBartenステップを使用しており、これは0.54%に等しい。次いで、RGB4:4:4について、1.2305のBartenステップにおいてただ目につく誤差が生じるのに対し、RGB4:2:0における誤差は33のBartenステップに等しく、これは明確に可視になるはずである。また、Rec709データで始めることは色がBT.2020の色域の縁の部分全てに到達するのを妨げるため、誤差はより小さい(195のBartenステップに対して33のBartenステップ)ことが妥当である。
最悪の誤差が青色原色近くで利用可能であることが最適化による結果でどのように見つけられるのかについても注目されたい。これは、可能性として、図22に見られるように、青のREC709原色がBT.2020の色域の縁に最も近いことによると思われる。
1.5 入力がP3データであるとき
BT.2020コンテナにおいて含有されるP3ソースデータについて同じテストが実行可能である。そして、最悪の色は、表A7に示されるように、(2.48、3.32、4.63)および(3.29、0、6.71)である。
誤差がRec709とBT.2020との間のどこかにあり、これがまたそのケースであると仮定し、ここで、40.38のBartenステップと同等の誤差が生じる。Barten値が変化するため、ループにおいて最悪の値を探索するときにこの誤差を含むことが重要であることは留意されたい。0.85%に等しい、1cd/mのBarten値が使用されている。
1.6 おわりに
この付録では、4:2:0のサブサンプリングによる輝度の誤差が究明されている。m35255[1]からの最悪の外れ値の適合は可能ではないが、一般データについてほぼ200のBartenステップに到達する最悪のケースの誤差は依然甚大である。ソースデータがRec709に拘束され、かつBT.2020コンテナに入れられる場合でも、誤差は依然甚大で30を上回るBartenステップがあり、BT.2020コンテナにおけるP3データについては、40を上回るBartenステップがある。
上述される実施形態は、本発明の数個の説明的な例として理解されるべきである。本発明の範囲から逸脱することなく、該実施形態に対するさまざまな修正、組み合わせ、および変更が可能であることは、当業者には理解されるであろう。特に、種々な実施形態における種々な部分的な解決策は、技術的に可能である場合、他の構成で組み合わせ可能である。さりながら、本発明の範囲は添付の特許請求の範囲によって規定される。

Claims (35)

  1. ピクチャ内の画素を前処理する方法であって、
    第1の色空間における前記画素の線形色に基づいて決定される第3の色空間における前記画素の元の線形輝度成分値を得ること(S1)と、
    第2の色空間における第1の非線形クロマ成分値、前記第2の色空間における第2の非線形クロマ成分値、および、第3の色空間における前記元の線形輝度成分値に基づいて、前記画素の前記第2の色空間における非線形輝度成分値を導出すること(S2)と、を含む、方法。
  2. 前記元の線形輝度成分値を得ること(S1)は、前記第1の色空間における前記線形色に基づいて前記第3の色空間における前記元の線形輝度成分値を決定すること(S1)を含む、請求項1に記載の方法。
  3. 前記非線形輝度成分値を導出すること(S2)は、前記第2の色空間における前記非線形輝度成分値、前記第2の色空間における前記第1の非線形クロマ成分値、および、前記第2の色空間における前記第2の非線形クロマ成分値に基づいて決定される、前記第3の色空間における前記元の線形輝度成分値と前記第3の色空間における線形輝度成分値との間の差異を最小化する前記第2の色空間における非線形輝度成分値を導出すること(S2)を含む、請求項1または2に記載の方法。
  4. 前記非線形輝度成分値を導出すること(S2)は、前記第2の色空間におけるサブサンプリングされた第1の非線形クロマ成分値、前記第2の色空間におけるサブサンプリングされた第2の非線形クロマ成分値、および、前記第3の色空間における前記元の線形輝度成分値に基づいて、前記第2の色空間における前記非線形輝度成分値を導出すること(S2)を含む、請求項1から3のいずれか一項に記載の方法。
  5. 前記第1の色空間における非線形色を捕えるために前記第1の色空間における前記線形色に第1の伝達関数を適用すること(S10)と、
    前記第2の色空間における非線形色を捕えるために前記第1の色空間における前記非線形色に第1の色変換を適用すること(S11)であって、前記第2の色空間における前記非線形色は、最初の第1の非線形クロマ成分値および最初の第2の非線形クロマ成分値を含む、適用することと、
    前記第2の色空間におけるサブサンプリングされた前記第1の非線形クロマ成分値および前記第2の色空間におけるサブサンプリングされた前記第2の非線形クロマ成分値を捕えるために、前記第2の色空間における前記最初の第1の非線形クロマ成分値および前記第2の色空間における前記最初の第2の非線形クロマ成分値をサブサンプリングすること(S12)と、を含む、請求項4に記載の方法。
  6. (i)前記第2の色空間におけるアップサンプリングされた第1の非線形クロマ成分値および前記第2の色空間におけるアップサンプリングされた第2の非線形クロマ成分値を捕えるために、前記第2の色空間における前記サブサンプリングされた第1の非線形クロマ成分値および前記第2の色空間における前記サブサンプリングされた第2の非線形クロマ成分値をアップサンプリングすること(S20)と、
    (ii)前記第1の色空間における非線形色を捕えるために、前記第2の色空間における候補の非線形輝度成分値、前記第2の色空間における前記アップサンプリングされた第1の非線形クロマ成分値、および前記第2の色空間における前記アップサンプリングされた第2の非線形クロマ成分値に第2の色変換を適用すること(S21)と、
    (iii)前記第1の色空間における線形色を捕えるために前記第1の色空間における前記非線形色に第2の伝達関数を適用すること(S22)と、
    (iv)前記第3の色空間における線形輝度成分値を捕えるために前記第1の色空間における前記線形色に第3の色変換を適用すること(S23)であって、前記非線形輝度成分値を導出すること(S2)は、前記第3の色空間における前記元の線形輝度成分値と前記第3の色空間における前記線形輝度成分値との比較に基づいて前記非線形輝度成分値を導出すること(S2)を含む、適用することと、をさらに含む、請求項4または5に記載の方法。
  7. 前記非線形輝度成分値を導出すること(S2)は、前記第3の色空間における前記元の線形輝度成分値と前記第3の色空間における前記線形輝度成分値との間の差異を低減する、前記第2の色空間における候補の非線形輝度成分値を選択すること(S2)を含む、請求項6に記載の方法。
  8. 前記第2の色空間における種々な候補の非線形輝度成分値に対してステップ(ii)〜(iv)(S21〜S23)を行うこと(L2)をさらに含み、前記候補の非線形輝度成分値を選択すること(S2)は、前記第3の色空間における前記元の線形輝度成分値と前記第3の色空間における線形輝度成分値との間の最小差異を生じさせる、前記第2の色空間における前記種々な候補の非線形輝度成分値の中から前記候補の非線形輝度成分値を選択すること(S2)を含む、請求項7に記載の方法。
  9. 前記第3の色空間における元の線形輝度成分値と前記第3の色空間における前記線形輝度成分値との間の差異を最小化する、前記第2の色空間における候補の非線形輝度成分値を選択するために二分探索を行うことをさらに含む、請求項6から8のいずれか一項に記載の方法。
  10. 前記第2の色空間におけるアップサンプリングされた第1の非線形クロマ成分値、および前記第2の色空間におけるアップサンプリングされた第2の非線形クロマ成分値を捕えるために、前記第2の色空間における前記サブサンプリングされた第1の非線形クロマ成分値、および前記第2の色空間における前記サブサンプリングされた第2の非線形クロマ成分値をアップサンプリングすること(S30)をさらに含み、前記非線形輝度成分値を導出すること(S2)は、ルックアップテーブルへの入力として、前記第3の色空間における前記元の非線形輝度成分値、またはこの非線形バージョン、前記第2の色空間における前記アップサンプリングされた第1の非線形クロマ成分値、および前記第2の色空間における前記アップサンプリングされた第2の非線形クロマ成分値、またはこの量子化バージョンを使用して、前記ルックアップテーブルから前記第2の色空間における前記非線形輝度成分値を検索すること(S32)を含む、請求項4または5に記載の方法。
  11. 前記第3の色空間における元の非線形輝度成分値を捕えるために前記第3の色空間における前記元の線形輝度成分値に前記第1の伝達関数を適用すること(S31)をさらに含み、前記非線形輝度成分値を導出すること(S2)は、前記ルックアップテーブルへの入力として、前記第3の色空間における前記元の非線形輝度成分値、前記第2の色空間における前記アップサンプリングされた第1の非線形クロマ成分値、および前記第2の色空間における前記アップサンプリングされた第2の非線形クロマ成分値、またはこの前記量子化バージョンを使用して、前記ルックアップテーブルから前記第2の色空間における前記非線形輝度成分値を検索すること(S32)を含む、請求項10に記載の方法。
  12. 前記ルックアップテーブルは、前記第3の色空間における前記元の線形輝度成分値、またはこの前記非線形バージョン、前記第2の色空間における前記アップサンプリングされた第1の非線形クロマ成分値、および前記第2の色空間における前記アップサンプリングされた第2の非線形クロマ成分値、またはこの前記量子化バージョンの各組み合わせに対して、前記第2の色空間における最適な前記非線形輝度成分値、前記第2の色空間における前記サブサンプリングされた第1の非線形クロマ成分値、および前記第2の色空間における前記サブサンプリングされた第2の非線形クロマ成分値に基づいて決定される、前記第3の色空間における前記元の非線形輝度成分値と前記第3の色空間における線形輝度成分値との間の差異を最小化する、前記第2の色空間における前記最適な非線形輝度成分値を含む、請求項10または11に記載の方法。
  13. ピクチャ内の画素を符号化する方法であって、
    前記画素の第2の色空間における非線形輝度成分値を導出するために請求項1から12のいずれか一項に記載の前記画素を前処理すること(S1、S2)と、
    前記非線形輝度成分値、前記第2の色空間におけるサブサンプリングされた第1の非線形クロマ成分値、および、前記第2の色空間におけるサブサンプリングされた第2の非線形クロマ成分値を符号化すること(S3)と、を含む、方法。
  14. ピクチャ内の画素を前処理するためのデバイス(100、110)であって、
    前記デバイス(100、110)は、第1の色空間における前記画素の線形色に基づいて決定される第3の色空間における前記画素の元の線形輝度成分値を得るように構成され、
    前記デバイス(100、110)は、第2の色空間における第1の非線形クロマ成分値、前記第2の色空間における第2の非線形クロマ成分値、および、前記第3の色空間における前記元の線形輝度成分値に基づいて、前記画素の前記第2の色空間における非線形輝度成分値を導出するように構成される、デバイス。
  15. 前記デバイス(100、110)は、前記第1の色空間における前記線形色に基づいて前記第3の色空間における前記元の線形輝度成分値を決定するように構成される、請求項14に記載のデバイス。
  16. 前記デバイス(100、110)は、前記第2の色空間における前記非線形輝度成分値、前記第2の色空間における前記第1の非線形クロマ成分値、および、前記第2の色空間における前記第2の非線形クロマ成分値に基づいて決定される、前記第3の色空間における前記元の線形輝度成分値と前記第3の色空間における線形輝度成分値との間の差異を最小化する前記第2の色空間における非線形輝度成分値を導出するように構成される、請求項14または15に記載のデバイス。
  17. 前記デバイス(100、110)は、前記第2の色空間におけるサブサンプリングされた第1の非線形クロマ成分値、前記第2の色空間におけるサブサンプリングされた第2の非線形クロマ成分値、および、前記第3の色空間における前記元の線形輝度成分値に基づいて、前記第2の色空間における前記非線形輝度成分値を導出するように構成される、請求項14から16のいずれか一項に記載のデバイス。
  18. 前記デバイス(100、110)は、前記第1の色空間における非線形色を捕えるために前記第1の色空間における前記元の線形色に第1の伝達関数を適用するように構成され、
    前記デバイス(100、110)は、前記第2の色空間における非線形色を捕えるために前記第1の色空間における前記非線形色に第1の色変換を適用するように構成され、前記第2の色空間における前記非線形色は、最初の第1の非線形クロマ成分値および最初の第2の非線形クロマ成分値を含み、
    前記デバイス(100、110)は、前記第2の色空間におけるサブサンプリングされた前記第1の非線形クロマ成分値および前記第2の色空間におけるサブサンプリングされた前記第2の非線形クロマ成分値を捕えるために、前記第2の色空間における前記最初の第1の非線形クロマ成分値および前記第2の色空間における前記最初の第2の非線形クロマ成分値をサブサンプリングするように構成される、請求項17に記載のデバイス。
  19. 前記デバイス(100、110)は、前記第2の色空間におけるアップサンプリングされた第1の非線形クロマ成分値および前記第2の色空間におけるアップサンプリングされた第2の非線形クロマ成分値を捕えるために、前記第2の色空間における前記サブサンプリングされた第1の非線形クロマ成分値および前記第2の色空間における前記サブサンプリングされた第2の非線形クロマ成分値をアップサンプリングするように構成され、
    前記デバイス(100、110)は、前記第1の色空間における非線形色を捕えるために、前記第2の色空間における候補の非線形輝度成分値、前記第2の色空間における前記アップサンプリングされた第1の非線形クロマ成分値、および前記第2の色空間における前記アップサンプリングされた第2の非線形クロマ成分値に第2の色変換を適用するように構成され、
    前記デバイス(100、110)は、前記第1の色空間における線形色を捕えるために前記第1の色空間における前記非線形色に第2の伝達関数を適用するように構成され、
    前記デバイス(100、110)は、前記第3の色空間における線形輝度成分値を捕えるために前記第1の色空間における前記線形色に第3の色変換を適用するように構成され、
    前記デバイス(100、110)は、前記第3の色空間における前記元の線形輝度成分値と前記第3の色空間における前記線形輝度成分値との比較に基づいて前記非線形輝度成分値を導出するように構成される、請求項17または18に記載のデバイス。
  20. 前記デバイス(100、110)は、前記第3の色空間における前記元の線形輝度成分値と前記第3の色空間における前記線形輝度成分値との間の差異を低減する、前記第2の色空間における候補の非線形輝度成分値を選択するように構成される、請求項19に記載のデバイス。
  21. 前記デバイス(100、110)は、前記第2の色空間における候補の非線形輝度成分値、前記第2の色空間における前記アップサンプリングされた第1の非線形クロマ成分値、および前記第2の色空間における前記アップサンプリングされた第2の非線形クロマ成分値への第2の色変換の適用と、前記第1の色空間における前記非線形色への前記第2の伝達関数の適用と、前記第2の色空間における種々な候補の非線形輝度成分値のための前記第1の色空間における前記線形色への第3の色変換の適用とを行うように構成され、
    前記デバイス(100、110)は、前記第3の色空間における前記元の線形輝度成分値と前記第3の色空間における前記線形輝度成分値との間に最小の差異を生じさせる、前記第2の色空間における前記種々な候補の非線形輝度成分値の中から前記候補の非線形輝度成分値を選択するように構成される、請求項20に記載のデバイス。
  22. 前記デバイス(100、110)は、前記第3の色空間における前記元の線形輝度成分値と前記第3の色空間における前記線形輝度成分値との間の差異を最小化する、前記第2の色空間における候補の非線形輝度成分値を選択するために二分探索を行うように構成される、請求項19から21のいずれか一項に記載のデバイス。
  23. 前記デバイス(100、110)は、前記第2の色空間におけるアップサンプリングされた第1の非線形クロマ成分値、および前記第2の色空間におけるアップサンプリングされた第2の非線形クロマ成分値を捕えるために、前記第2の色空間における前記サブサンプリングされた第1の非線形クロマ成分値、および前記第2の色空間における前記サブサンプリングされた第2の非線形クロマ成分値をアップサンプリングするように構成され、
    前記デバイス(100、110)は、ルックアップテーブルへの入力として、前記第3の色空間における前記元の線形輝度成分値、またはこの非線形バージョン、前記第2の色空間における前記アップサンプリングされた第1の非線形クロマ成分値、および前記第2の色空間における前記アップサンプリングされた第2の非線形クロマ成分値、またはこの量子化バージョンを使用して、前記ルックアップテーブルから前記第2の色空間における前記非線形輝度成分値を検索するように構成される、請求項17または18に記載のデバイス。
  24. 前記デバイス(100、110)は、前記第3の色空間における元の非線形輝度成分値を捕えるために前記第3の色空間における前記元の線形輝度成分値に前記第1の伝達関数を適用するように構成され、
    前記デバイス(100、110)は、前記ルックアップテーブルへの入力として、前記第3の色空間における前記元の非線形輝度成分値、前記第2の色空間における前記アップサンプリングされた第1の非線形クロマ成分値、および前記第2の色空間における前記アップサンプリングされた第2の非線形クロマ成分値、またはこの前記量子化バージョンを使用して、前記ルックアップテーブルから前記第2の色空間における前記非線形輝度成分値を検索するように構成される、請求項23に記載のデバイス。
  25. プロセッサ(111)と、
    前記プロセッサ(111)によって実行可能な命令を含むメモリ(112)と、をさらに含み、
    前記プロセッサ(111)は、前記第3の色空間における前記画素の前記元の線形輝度成分値を得るように動作可能であり、
    前記プロセッサ(111)は、前記画素の前記第2の色空間における前記非線形輝度成分値を導出するように動作可能である、請求項14から24のいずれか一項に記載のデバイス。
  26. ピクチャ内の画素を前処理するためのデバイス(120)であって、
    第1の色空間における前記画素の線形色に基づいて決定される第3の色空間における前記画素の元の線形輝度成分値を得るための決定部(121)と、
    前記画素の第2の色空間における非線形輝度成分値を、前記第2の色空間における第1の非線形クロマ成分値、前記第2の色空間における第2の非線形クロマ成分値、および、前記第3の色空間における前記元の線形輝度成分値に基づいて導出するための導出部(122)と、を含む、デバイス。
  27. ピクチャ内の画素を符号化するためのデバイス(110)であって、
    プロセッサ(111)と、
    前記プロセッサ(111)によって実行可能な命令を含むメモリ(112)と、を含み、
    前記プロセッサ(111)は、第1の色空間における前記画素の線形色に基づいて決定される第3の色空間における前記画素の元の線形輝度成分値を得るように動作可能であり、
    前記プロセッサ(111)は、前記画素の第2の色空間における非線形輝度成分値を、前記第2の色空間における第1の非線形クロマ成分値、前記第2の色空間における第2の非線形クロマ成分値、および、前記第3の色空間における前記元の線形輝度成分値に基づいて導出するように動作可能であり、
    前記プロセッサ(111)は、前記非線形輝度成分値、前記第1の非線形クロマ成分値、および、前記第2の非線形クロマ成分値を符号化するように動作可能である、デバイス。
  28. ピクチャ内の画素を符号化するためのデバイス(120)であって、
    第1の色空間における前記画素の線形色に基づいて決定される第3の色空間における前記画素の元の線形輝度成分値を得るための決定部(121)と、
    前記画素の第2の色空間における非線形輝度成分値を、前記第2の色空間における第1の非線形クロマ成分値、前記第2の色空間における第2の非線形クロマ成分値、および、前記第3の色空間における前記元の線形輝度成分値に基づいて導出するための導出部(122)と、
    前記非線形輝度成分値、前記第1の非線形クロマ成分値、および、前記第2の非線形クロマ成分値を符号化するためのエンコーダ(123)と、を含む、デバイス。
  29. 請求項14から28のいずれか一項に記載のデバイス(100、110、120)を含むユーザ機器(5、200)であって、ビデオデータを受信しかつ処理するように構成されるデバイスまたは装置である、ユーザ機器。
  30. 請求項14から28のいずれか一項に記載のデバイス(100、110、120)を含むユーザ機器(5、200)であって、前記ユーザ機器(5、200)は、コンピュータ、ラップトップ、スマートフォン、タブレット、およびセットトップボックスから成るグループから選択される、ユーザ機器。
  31. プロセッサ(210)によって実行されたとき、前記プロセッサ(210)に、
    第1の色空間における画素の線形色に基づいて決定される、第3の色空間におけるピクチャにおける前記画素の元の線形輝度成分値を得させ、
    前記第2の色空間における第1の非線形クロマ成分値、前記第2の色空間における第2の非線形クロマ成分値、および、前記第3の色空間における前記元の線形輝度成分値に基づいて、前記画素の第2の色空間における非線形輝度成分値を導出させる命令を含む、コンピュータプログラム(240)。
  32. 前記コンピュータプログラム(240)は、前記プロセッサ(210)によって実行されたとき、前記プロセッサ(210)に、前記非線形輝度成分値、前記第1の非線形クロマ成分値、および前記第2の非線形クロマ成分値を符号化させる命令をさらに含む、請求項31に記載のコンピュータプログラム。
  33. 請求項31また32に記載のコンピュータプログラム(240)を含むキャリア(250)であって、前記キャリアは、電子信号、光信号、電磁信号、磁気信号、電気信号、無線信号、マイクロ波信号、または、コンピュータ可読記憶媒体のうちの1つである、キャリア。
  34. ピクチャ内の画素の符号化バージョンを表す信号であって、前記符号化バージョンは、第2の色フォーマットにおけるサブサンプリングされた第1の非線形クロマ成分値の符号化バージョンと、前記第2の色空間におけるサブサンプリングされた第2の非線形クロマ成分値と、請求項1から12のいずれか一項に記載の導出された前記第2の色フォーマットにおける非線形輝度成分値の符号化バージョンと、を含む、信号。
  35. 前記信号は、電子信号、光信号、電磁信号、磁気信号、電気信号、無線信号、およびマイクロ波信号のうちの1つである、請求項34に記載の信号。
JP2017542096A 2015-02-13 2016-01-28 画素の前処理および符号化 Active JP6516851B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201562115679P 2015-02-13 2015-02-13
US62/115,679 2015-02-13
PCT/SE2016/050058 WO2016130066A1 (en) 2015-02-13 2016-01-28 Pixel pre-processing and encoding

Publications (2)

Publication Number Publication Date
JP2018511210A true JP2018511210A (ja) 2018-04-19
JP6516851B2 JP6516851B2 (ja) 2019-05-22

Family

ID=56614572

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017542096A Active JP6516851B2 (ja) 2015-02-13 2016-01-28 画素の前処理および符号化

Country Status (10)

Country Link
US (2) US9654803B2 (ja)
EP (1) EP3257042B1 (ja)
JP (1) JP6516851B2 (ja)
KR (1) KR102033229B1 (ja)
CN (1) CN107210026B (ja)
DK (1) DK3257042T3 (ja)
ES (1) ES2925352T3 (ja)
MY (1) MY177576A (ja)
RU (1) RU2679239C1 (ja)
WO (1) WO2016130066A1 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10715772B2 (en) 2015-11-09 2020-07-14 Netflix, Inc. High dynamic range color conversion correction
US10742986B2 (en) 2015-11-09 2020-08-11 Netflix, Inc. High dynamic range color conversion correction
US10750146B2 (en) 2015-11-09 2020-08-18 Netflix, Inc. High dynamic range color conversion correction

Families Citing this family (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9346127B2 (en) 2014-06-20 2016-05-24 Velo3D, Inc. Apparatuses, systems and methods for three-dimensional printing
EP3298787B1 (en) * 2015-05-21 2021-03-24 Telefonaktiebolaget LM Ericsson (publ) Pixel pre-processing and encoding
WO2017016526A1 (en) * 2015-07-30 2017-02-02 Zhejiang Dahua Technology Co., Ltd. Methods and systems for image compression
CN108367498A (zh) 2015-11-06 2018-08-03 维洛3D公司 Adept三维打印
WO2017100695A1 (en) 2015-12-10 2017-06-15 Velo3D, Inc. Skillful three-dimensional printing
US9919360B2 (en) 2016-02-18 2018-03-20 Velo3D, Inc. Accurate three-dimensional printing
WO2017153376A1 (en) * 2016-03-07 2017-09-14 Koninklijke Philips N.V. Encoding and decoding hdr videos
CN109479151B (zh) 2016-05-16 2022-03-11 瑞典爱立信有限公司 采用颜色分量的像素处理
WO2018005439A1 (en) 2016-06-29 2018-01-04 Velo3D, Inc. Three-dimensional printing and three-dimensional printers
US11691343B2 (en) 2016-06-29 2023-07-04 Velo3D, Inc. Three-dimensional printing and three-dimensional printers
WO2018067052A1 (en) * 2016-10-04 2018-04-12 Telefonaktiebolaget Lm Ericsson (Publ) Pre-processing of hdr video involving chroma adjustment
US10880558B2 (en) 2016-10-05 2020-12-29 Telefonaktiebolaget Lm Ericsson (Publ) Efficient LUT implementation of luma adjustment
US20180126460A1 (en) 2016-11-07 2018-05-10 Velo3D, Inc. Gas flow in three-dimensional printing
EP3560200A4 (en) * 2016-12-23 2019-11-13 Telefonaktiebolaget LM Ericsson (publ) CHROMINANCE ADJUSTMENT WITH COLOR COMPONENTS IN VIDEO ENCODED COLOR SPACES
US10611092B2 (en) 2017-01-05 2020-04-07 Velo3D, Inc. Optics in three-dimensional printing
US10357829B2 (en) 2017-03-02 2019-07-23 Velo3D, Inc. Three-dimensional printing of three-dimensional objects
US10555004B1 (en) * 2017-09-22 2020-02-04 Pixelworks, Inc. Low frequency compensated encoding
WO2019071045A1 (en) * 2017-10-04 2019-04-11 Netflix, Inc. HIGH DYNAMIC RANGE COLORING CORRECTION
US10272525B1 (en) 2017-12-27 2019-04-30 Velo3D, Inc. Three-dimensional printing systems and methods of their use
EP3591955A1 (en) * 2018-07-06 2020-01-08 InterDigital VC Holdings, Inc. Method of processing data by an iterative application of a same lut
US20220245862A1 (en) * 2020-04-28 2022-08-04 Shenzhen Sitan Technology Co., Ltd. Image processing method and device, camera apparatus and storage medium

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2007132635A1 (ja) * 2006-05-15 2007-11-22 Sharp Kabushiki Kaisha カラー画像表示装置及び色変換装置
WO2010004726A1 (ja) * 2008-07-08 2010-01-14 パナソニック株式会社 画像符号化方法、画像復号方法、画像符号化装置、画像復号装置、プログラム、及び集積回路
US20130156311A1 (en) * 2011-12-16 2013-06-20 Samsung Electronics Co., Ltd. Method and apparatus for processing image signal
WO2016120330A1 (en) * 2015-01-30 2016-08-04 Thomson Licensing Method and device for decoding a color picture
WO2016120209A1 (en) * 2015-01-30 2016-08-04 Thomson Licensing A method and apparatus of encoding and decoding a color picture

Family Cites Families (31)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US601027A (en) 1898-03-22 trussell
US5450217A (en) * 1994-05-23 1995-09-12 Xerox Corporation Image-dependent color saturation correction in a natural scene pictorial image
CN1106118C (zh) * 1998-09-29 2003-04-16 华邦电子股份有限公司 色彩空间信号转换装置及方法
US6954214B2 (en) * 2000-10-30 2005-10-11 Microsoft Corporation Efficient perceptual/physical color space conversion
JP3818098B2 (ja) * 2001-08-17 2006-09-06 ソニー株式会社 画像信号処理方法及び画像信号処理装置
US20030123072A1 (en) * 2001-11-02 2003-07-03 Spronk Conernelis Adrianus Maria System and method for color transformation using standardized device profiles
DE10204500A1 (de) * 2002-02-03 2003-08-14 Fraunhofer Ges Forschung Echtzeitfähiges Erkennungs- und Kompensationsverfahren von Beleuchtungsschwankungen in digitalen Farbbildsignalen
US7643675B2 (en) 2003-08-01 2010-01-05 Microsoft Corporation Strategies for processing image information using a color information data structure
JP2005208817A (ja) * 2004-01-21 2005-08-04 Konica Minolta Photo Imaging Inc 画像処理方法、画像処理装置及び画像記録装置
US7916940B2 (en) * 2004-01-31 2011-03-29 Hewlett-Packard Development Company Processing of mosaic digital images
RU2402811C2 (ru) * 2004-07-29 2010-10-27 Майкрософт Корпорейшн Обработка изображений с помощью линейных параметров светоустановки и других усовершенствований обработки изображений
US7349484B2 (en) * 2004-12-22 2008-03-25 Rambus Inc. Adjustable dual-band link
US8326027B2 (en) * 2006-07-25 2012-12-04 Nikon Corporation Conversion matrix determining method, image processing device, image processing program and imaging apparatus
CN101354450B (zh) * 2007-07-26 2012-03-14 鸿富锦精密工业(深圳)有限公司 光学板及其制备方法
US8130236B2 (en) * 2008-02-05 2012-03-06 Aptina Imaging Corporation Systems and methods to achieve preferred imager color reproduction
JP5436584B2 (ja) * 2009-03-10 2014-03-05 ドルビー ラボラトリーズ ライセンシング コーポレイション 拡張ダイナミックレンジおよび拡張次元をもつ画像信号変換
TWI390961B (zh) * 2009-03-13 2013-03-21 Asustek Comp Inc 影像處理裝置及影像處理方法
JP5370761B2 (ja) * 2009-04-10 2013-12-18 ソニー株式会社 映像信号処理装置および表示装置
TWI424427B (zh) * 2009-05-13 2014-01-21 Chunghwa Picture Tubes Ltd 色彩轉換方法以及其相對應之色彩顯示方法
US8311355B2 (en) * 2009-06-05 2012-11-13 Apple Inc. Skin tone aware color boost for cameras
US9049410B2 (en) * 2009-12-23 2015-06-02 Samsung Display Co., Ltd. Color correction to compensate for displays' luminance and chrominance transfer characteristics
US8285033B2 (en) * 2010-04-01 2012-10-09 Seiko Epson Corporation Bi-affinity filter: a bilateral type filter for color images
CN103119936B (zh) * 2010-09-16 2017-06-13 皇家飞利浦电子股份有限公司 用于图像的改进的编码的设备和方法
WO2012106122A1 (en) * 2011-01-31 2012-08-09 Malvell World Trade Ltd. Systems and methods for performing color adjustments of pixels on a color display
US8919476B2 (en) * 2011-07-11 2014-12-30 Holland Moving & Rigging Supplies, Inc. Platform dolly system
US20130085893A1 (en) * 2011-09-30 2013-04-04 Ebay Inc. Acquisition and use of query images with image feature data
US9142012B2 (en) * 2012-05-31 2015-09-22 Apple Inc. Systems and methods for chroma noise reduction
US20140066196A1 (en) * 2012-08-30 2014-03-06 Colin William Crenshaw Realtime color vision deficiency correction
WO2015124754A1 (en) * 2014-02-21 2015-08-27 Koninklijke Philips N.V. High definition and high dynamic range capable video decoder
CN104159053B (zh) * 2014-08-08 2017-08-15 浙江大学 一种大色域显示设备三原色优化设置方法
CN104243946B (zh) * 2014-09-26 2017-04-19 深圳市华星光电技术有限公司 用于显示器的图像色彩增强方法及装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2007132635A1 (ja) * 2006-05-15 2007-11-22 Sharp Kabushiki Kaisha カラー画像表示装置及び色変換装置
WO2010004726A1 (ja) * 2008-07-08 2010-01-14 パナソニック株式会社 画像符号化方法、画像復号方法、画像符号化装置、画像復号装置、プログラム、及び集積回路
US20130156311A1 (en) * 2011-12-16 2013-06-20 Samsung Electronics Co., Ltd. Method and apparatus for processing image signal
WO2016120330A1 (en) * 2015-01-30 2016-08-04 Thomson Licensing Method and device for decoding a color picture
WO2016120209A1 (en) * 2015-01-30 2016-08-04 Thomson Licensing A method and apparatus of encoding and decoding a color picture

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10715772B2 (en) 2015-11-09 2020-07-14 Netflix, Inc. High dynamic range color conversion correction
US10742986B2 (en) 2015-11-09 2020-08-11 Netflix, Inc. High dynamic range color conversion correction
US10750146B2 (en) 2015-11-09 2020-08-18 Netflix, Inc. High dynamic range color conversion correction

Also Published As

Publication number Publication date
CN107210026A (zh) 2017-09-26
US10397536B2 (en) 2019-08-27
US9654803B2 (en) 2017-05-16
ES2925352T3 (es) 2022-10-17
BR112017017434A8 (pt) 2022-09-06
EP3257042A4 (en) 2018-02-14
KR20170103937A (ko) 2017-09-13
CN107210026B (zh) 2020-02-14
EP3257042A1 (en) 2017-12-20
BR112017017434A2 (pt) 2018-04-03
JP6516851B2 (ja) 2019-05-22
RU2679239C1 (ru) 2019-02-06
KR102033229B1 (ko) 2019-10-16
DK3257042T3 (da) 2022-08-01
US20160241885A1 (en) 2016-08-18
MY177576A (en) 2020-09-21
US20170208310A1 (en) 2017-07-20
EP3257042B1 (en) 2022-06-22
WO2016130066A1 (en) 2016-08-18

Similar Documents

Publication Publication Date Title
JP6516851B2 (ja) 画素の前処理および符号化
JP6582062B2 (ja) 画素の前処理および符号化
CN107852513B (zh) 对输入视频序列的像素进行编码
CN107615761B (zh) 用于像素处理和编码的方法、设备和计算机可读介质
CN109479151B (zh) 采用颜色分量的像素处理
KR20180044291A (ko) 코딩 및 디코딩 방법과 대응하는 디바이스
CN107925778B (zh) 像素预处理和编码
US10602109B2 (en) Method and arrangements for HDR encoding
EP3026908A1 (en) Method and device for quantizing and de-quantizing a picture using scaling factors for chrominance based on luminance

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20181002

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20180928

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20181228

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190218

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20190319

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20190416

R150 Certificate of patent or registration of utility model

Ref document number: 6516851

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250