JP2022542312A - 電気-光伝達関数変換及び信号適法化 - Google Patents

電気-光伝達関数変換及び信号適法化 Download PDF

Info

Publication number
JP2022542312A
JP2022542312A JP2022506085A JP2022506085A JP2022542312A JP 2022542312 A JP2022542312 A JP 2022542312A JP 2022506085 A JP2022506085 A JP 2022506085A JP 2022506085 A JP2022506085 A JP 2022506085A JP 2022542312 A JP2022542312 A JP 2022542312A
Authority
JP
Japan
Prior art keywords
optical transfer
transfer function
function
sample pixels
electro
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2022506085A
Other languages
English (en)
Other versions
JP7574277B2 (ja
Inventor
スゥ,グワン-ミーン
カドゥ,ハルシャッド
ジェイ. ガドジル,ニーラジ
ソーン,チーン
ユン リー,ヨン
Original Assignee
ドルビー ラボラトリーズ ライセンシング コーポレイション
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ドルビー ラボラトリーズ ライセンシング コーポレイション filed Critical ドルビー ラボラトリーズ ライセンシング コーポレイション
Publication of JP2022542312A publication Critical patent/JP2022542312A/ja
Application granted granted Critical
Publication of JP7574277B2 publication Critical patent/JP7574277B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N25/00Circuitry of solid-state image sensors [SSIS]; Control thereof
    • H04N25/60Noise processing, e.g. detecting, correcting, reducing or removing noise
    • H04N25/61Noise processing, e.g. detecting, correcting, reducing or removing noise the noise originating only from the lens unit, e.g. flare, shading, vignetting or "cos4"
    • H04N25/615Noise processing, e.g. detecting, correcting, reducing or removing noise the noise originating only from the lens unit, e.g. flare, shading, vignetting or "cos4" involving a transfer function modelling the optical system, e.g. optical transfer function [OTF], phase transfer function [PhTF] or modulation transfer function [MTF]
    • H04N25/6153Noise processing, e.g. detecting, correcting, reducing or removing noise the noise originating only from the lens unit, e.g. flare, shading, vignetting or "cos4" involving a transfer function modelling the optical system, e.g. optical transfer function [OTF], phase transfer function [PhTF] or modulation transfer function [MTF] for colour signals
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/90Dynamic range modification of images or parts thereof
    • G06T5/92Dynamic range modification of images or parts thereof based on global image properties
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/154Measured or subjectively estimated visual quality after decoding, e.g. measurement of distortion
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/40Image enhancement or restoration using histogram techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/50Image enhancement or restoration using two or more images, e.g. averaging or subtraction
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/90Determination of colour characteristics
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/46Colour picture communication systems
    • H04N1/56Processing of colour picture signals
    • H04N1/60Colour correction or control
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/186Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a colour or a chrominance component
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/85Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/98Adaptive-dynamic-range coding [ADRC]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10016Video; Image sequence
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10024Color image

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Image Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Liquid Crystal Display Device Control (AREA)

Abstract

装置は電子プロセッサを含み、該電子プロセッサは、受信した映像データ決定されたから一組のサンプルピクセルから、第1の色空間の第1の色表現における第1の電気-光伝達関数(EOTF)に従った第1組のサンプルピクセルを画定し、第1組のサンプルピクセルを、マッピング関数を介して第2のEOTFに変換して、第2のEOTFに従った第2組のサンプルピクセルを生成し、第1組及び第2組のサンプルピクセルを、第1の色表現から第1の色空間の第2の色表現に変換し、変換した第1組のピクセルにサンプルバックワードリシェイピング関数を適用することによって得られる予測ピクセル値と変換した第2組のピクセルとの間の差を最小化するように、サンプルバックワードリシェイピング関数を繰り返し適用及び調整することによって、バックワードリシェイピング関数を決定するように構成される。

Description

この出願は、2019年7月30日に出願された米国仮特許出願第62/880,266号及び2019年7月30日に出願された欧州特許出願第19189052.4号に対する優先権を主張するものであり、これらの各々をその全体にてここに援用する。
この出願は、概して、高ダイナミックレンジ映像(HDR)用の映像信号変換に関する。
ここで使用されるとき、用語“ダイナミックレンジ”(DR)は、例えば最も暗い黒(ダーク)から最も明るい白(ハイライト)まで、画像における強度(例えば、輝度、ルマ)の範囲を知覚する人間の視覚系(human visual system;HVS)の能力に関するとし得る。この意味で、DRは“シーン参照”強度に関する。DRはまた、特定の幅の強度範囲を十分又は適切にレンダリングするディスプレイ装置の能力にも関し得る。この意味で、DRは“ディスプレイ参照”強度に関する。ここでの記載のいずれかの時点において特定の意味を持つとして特定の意味が明示的に規定されない限り、この用語は、例えば交換可能に、いずれの意味でも使用され得ると推測されるべきである。
ここで使用されるとき、高ダイナミックレンジという用語は、人間の視覚系(HVS)のおよそ14-15桁の大きさに及ぶDR幅に関係する。実際には、人間がその強度範囲内の広い範囲を同時に知覚できるDRは、HDRに対して幾分切り捨てられてしまい得る。ここで使用されるとき、エンハンストダイナミックレンジ(EDR)又はビジュアルダイナミックレンジ(VDR)という用語は、個別に、あるいは交換可能に、目の動きを含んでシーン又は画像にわたっての光順応変化を可能にする人間の視覚系(HVS)によってシーン又は画像内で知覚可能なDRに関し得る。ここで使用されるとき、EDRは、5-6桁の大きさのDRに関係し得る。従って、HDRとされる真のシーンに対して幾分狭くなり得るが、EDRはそれでも広いDR幅を表し、HDRとも称され得る。
実際には、画像は1つ以上の色成分(例えば、ルマYとクロマCb及びCr)を有し、各色成分が、ピクセル当たりnビットの精度(例えば、n=8)で表される。線形ルミナンスコーディングを用いると、n≦8の画像(例えば、カラーの24ビットJPEG画像)は標準ダイナミックレンジの画像とみなされ、n>8の画像はエンハンストダイナミックレンジの画像とみなされ得る。
所与のディスプレイに関する参照電気-光伝達関数(electro-optical transfer function;EOTF)が、入力映像信号のカラー値(例えば、ルミナンス)の、ディスプレイによって生成されるスクリーンカラー値(例えば、スクリーンルミナンス)に対する関係を特徴付ける。例えば、ITU勧告ITU-R BT.1886は、陰極線管(CRT)の測定特性に基づいてフラットパネルディスプレイ用の参照EOTFを定めている。映像ストリームを所与として、そのEOTFに関する情報は典型的にメタデータとしてビットストリームに埋め込まれる。ここで使用されるとき、用語“メタデータ”は、符号化ビットストリームの一部として伝送されてデコーダが復号画像をレンダリングするのを支援する任意の補助情報に関する。そのようなメタデータは、以下に限られないが、ここに記載されるもののような、色空間又は色域情報、参照ディスプレイパラメータ、及び補助信号パラメータを含み得る。ここで、BT.1886、Rec.2020、BT.2100、及びこれらに類するものは、国際電気通信連合(ITU)により発表されたHDR映像の様々な態様に関する定義の集合を指す。
大抵の消費者向けデスクトップディスプレイは、現在、200-300cd/m又はニットの輝度をサポートしている。大抵の消費者向けHDTVは300-500ニットの範囲に及び、一部のモデルは1000ニット(cd/m)に達している。そのような従来ディスプレイは、このように、HDR又はEDRとの関係で標準ダイナミックレンジ(SDR)とも呼ばれる、低めのダイナミックレンジ(LDR)を典型とする。キャプチャ機器(例えば、カメラ)とHDRディスプレイ(例えば、ドルビーラボラトリーズ社からのPRM-4200プロフェッショナル参照モニタ)との両方の進歩により、HDRコンテンツの利用可能性が増大するにつれて、HDRコンテンツは、カラーグレード化され、より高いダイナミックレンジ(例えば、1,000ニットから5,000ナイト以上)をサポートするHDRディスプレイ上に表示されることになり得る。そのようなディスプレイは、高輝度能力(例えば、0-10,000ニット)をサポートする代わりのEOTFを用いて規定されることがある。そのようなEOTFの一例が、SMPTE ST 2084:2014“High Dynamic Range EOTF of Mastering Reference Displays”に規定されている。一般に、限定ではなく、本開示の方法は任意のダイナミックレンジに関する。
ここで使用されるとき、用語“フォワードリシェイピング”(forward reshaping)は、元のビット深度及び符号化フォーマット(例えば、ガンマ又はSMPTE 2084)からの画像を、より低い又は同じビット深度及び異なる符号化フォーマットの画像にマッピング(又は量子化)するプロセスを表し、これは、ある符号化法(例えばAVC、HEVC、及びこれらに類するものなど)を使用して、向上された圧縮を可能にする。受信器にて、リシェイピングされた信号を解凍した後、受信器は、逆リシェイピング関数を適用して、信号を元の高ダイナミックレンジに復元し得る。受信器は、ルックアップテーブル(LUT)として、又は例えば関数のマルチピース多項式近似の係数といったパラメトリック形式にて、バックワードリシェイピング(backward reshaping)関数を受信し得る。
このセクションに記載されたアプローチは、先に進められ得るアプローチであり、必ずしもこれまでに考案又は追求されたアプローチではない。従って、別段の断りがない限り、このセクションに記載されたアプローチのいずれも、それらがこのセクションに含まれていることのみを理由にして従来技術をなすと想定されるべきでない。同様に、1以上のアプローチに関して特定された問題は、別段の断りがない限り、このセクションに基づいて、何らかの従来技術において認識されていたと想定されるべきでない。
本開示の様々な態様は、改良された電気-光伝達関数変換、信号適法化、及びバックワードリシェイピング関数のためのシステム及び方法に関する。
本開示の例示的な一態様にて、装置が提供される。当該装置は電子プロセッサを含む。当該装置は、ターゲットディスプレイ上に映像をレンダリングするためのバックワードリシェイピング関数を決定するためのものである。
電子プロセッサは、受信した映像データから一組のサンプルピクセルを決定し、該一組のサンプルピクセルから、第1の色空間の第1の色表現における第1の電気-光伝達関数に従った第1組のサンプルピクセルを画定し、第1組のサンプルピクセルを、マッピング関数を介して、第1の色空間の第1の色表現における第2の電気-光伝達関数に変換して、第1組のサンプルピクセルから第2の電気-光伝達関数に従った第2組のサンプルピクセルを生成し、第1組のサンプルピクセル及び第2組のサンプルピクセルを、第1の色表現から第1の色空間の第2の色表現に変換し、そして、変換した第1組のサンプルピクセル及び変換した第2組のサンプルピクセルに基づいてバックワードリシェイピング関数を決定するように構成される。電子プロセッサは、変換した第1組のサンプルピクセル内のピクセルにサンプルバックワードリシェイピング関数を適用することによって得られる予測ピクセル値と、変換した第2組のサンプルピクセル内のピクセルと、の間の差を最小化するように、サンプルバックワードリシェイピング関数を繰り返し適用及び調整することによって、バックワードリシェイピング関数を決定するように構成される。
本開示の例示的な他の一態様にて、この装置は、信号を変換する方法及び/又はコンピュータのプロセッサによって実行されるときに該コンピュータに処理を実行させる命令を格納した非一時的なコンピュータ読み取り可能媒体として又はそれを備えて実装され得る。
本開示の様々な態様は、変換の速さ、変換の効率、変換の精度、及びこれらに類するものにおける向上を提供し得る。斯くして、本開示の様々な態様は、少なくともHDR-TV画像レンダリング、信号処理、及びこれらに類するものの技術分野における画像の変換及び改良を提供する。
添付の図面においては、別々の図を通して同じ又は機能的に同様の要素は似通った参照符号で指しており、それが、以下の詳細な説明と共に明細書に組み込まれて明細書の一部を形成して、態様を更に例示するとともにそれら態様の様々な原理及び利点を説明する役割を果たす。
本開示の様々な態様に従った映像配信パイプラインの例示的なプロセスである。 本開示の様々な態様に従ったコンテンツ適応リシェイピングのための例示的なプロセスである。 本開示の様々な態様に従った予測アルゴリズム例の出力を示すプロットである。 本開示の様々な態様に従った予測アルゴリズム例の出力を示すプロットである。 本開示の様々な態様に従った予測アルゴリズム例の出力を示すプロットである。 本開示の様々な態様に従って生成される予測関数に基づいてプロセスのための例示的なバックワードリシェイピング関数を決定することのプロセスフロー図である。 本開示の様々な態様に従って生成される予測関数に基づいてプロセスのための例示的なバックワードリシェイピング関数を決定することのプロセスフロー図である。 本開示の様々な態様に従って生成される予測関数に基づいてプロセスのための例示的なバックワードリシェイピング関数を決定することのプロセスフロー図である。 本開示の様々な態様に従って生成される予測関数に基づいてプロセスのための例示的なバックワードリシェイピング関数を決定することのプロセスフロー図である。 本開示の様々な態様に従ったバックワードリシェイピング機能を決定する例示的な方法を示すフローチャートである。 本開示の様々な態様に従った信号適法化のための例示的な区分方程式のプロットである。 本開示の様々な態様に従った信号適法化のための例示的な近似S字曲線のプロットである。 本開示の様々な態様に従った、図4のプロセスを実装することが可能な例示的なプロセッシング装置のブロック図である。
当業者が理解することには、図中の要素は、明瞭であるように示されており、必ずしも縮尺通りに描かれていない。例えば、本開示の態様の理解を高める助けとなるよう、図中の一部の要素の寸法が他の要素に対して誇張されていることがある。
ここでの説明の利益を有する当業者に容易に明らかとなる詳細で本開示を不明瞭にしないよう、装置及び方法のコンポーネントは、適宜に図中の記号によって表されて、本開示の態様の理解に関連する特定の詳細のみを示している。
概説
この概説は、本開示の一部の態様の基本的な説明を提示するものである。なお、この概説は、本開示の態様の広範な又は網羅的な要約ではない。また、言及しておくべきことには、この概説は、本開示の特に重要な態様又は要素を特定するものや、特に態様の範囲を定めるものや、全般的な開示として理解されることを意図していない。この概説は、単に、態様例に関係する一部の概念を要約及び単純化した形式で提示するものに過ぎず、以下に続く態様のより詳細な説明への概念的前提に過ぎないと理解されるべきである。なお、別々の態様がここに説明されるが、ここに説明される態様及び/又は部分的態様の任意の組み合わせが為され得る。
ここに記載される技術は、映像コンテンツの表示、及び/又は(1つ以上の)映像ストリーミングサーバと(1つ以上の)映像ストリーミングクライアントとの間での映像コンテンツのストリーミングを含み得るものである映像アプリケーションにおける、メモリ帯域幅、データレート、及び/又は計算複雑性に対する要求を最小化するために使用されることができる。
ここに記載される映像アプリケーションは、映像ディスプレイアプリケーション、仮想現実(VR)アプリケーション、拡張現実(AR)アプリケーション、自動車エンターテイメントアプリケーション、リモートプレゼンスアプリケーション、ディスプレイアプリケーション、及びこれらに類するもののうちのいずれか1つ以上を指し得る。映像コンテンツの例は、以下に限られないが、オーディオビジュアル番組、映画、映像番組、TV放送、コンピュータゲーム、ARコンテンツ、VRコンテンツ、自動車エンターテイメントコンテンツ、及びこれらに類するものを含み得る。
映像ストリーミングクライアントの例は、必ずしも以下に限られるわけではないが、ディスプレイ装置、目付近にディスプレイを備えたコンピューティング装置、ヘッドマウントディスプレイ(HMD)、モバイル装置、ウェアラブルディスプレイ装置、例えばテレビジョンなどのディスプレイを備えたセットトップボックス、ビデオモニタ、及びこれらに類するものを含み得る。
ここで使用されるとき、“映像ストリーミングサーバ”は、1つ以上のディスプレイ上に全方向映像コンテンツの少なくとも一部(例えば、ユーザの視野又はビューポートなどに対応する)をレンダリングするために、全方向映像コンテンツを準備して1つ以上の映像ストリーミングクライアントにストリーミングする1つ以上のアップストリーム装置を指し得る。全方向映像コンテンツがレンダリングされるディスプレイは、1つ以上の映像ストリーミングクライアントの一部であってもよいし、1つ以上の映像ストリーミングクライアントと共に動作してもよい。
映像ストリーミングサーバの例は、必ずしも以下に限られるわけではないが、(1つ以上の)映像ストリーミングクライアントから遠隔に位置するクラウドベースの映像ストリーミングサーバ、ローカルな有線又は無線ネットワーク上で(1つ以上の)映像ストリーミングクライアントに接続されたローカルな映像ストリーミングサーバ、VR装置、AR装置、自動車エンターテイメント装置、デジタルメディア装置、デジタルメディア受信器、セットトップボックス、ゲーム機(例えば、Xbox(登録商標))、汎用パーソナルコンピュータ、タブレット、例えばアップルTV(登録商標)又はRoku(登録商標)ボックスなどの専用デジタルメディア受信器などを含み得る。
この開示及びその態様は、コンピュータ実装された方法、コンピュータプログラムプロダクト、コンピュータシステム及びネットワーク、ユーザインタフェース、及びアプリケーションプログラミングインタフェースによって制御されるハードウェア又は回路、並びに、ハードウェア実装された方法、信号処理回路、メモリアレイ、特定用途向け集積回路、フィールドプログラマブルゲートアレイ、及びこれらに類するものを含め、様々な形態で具現化されることができる。前述の概要は、単に本開示の様々な態様の一般的アイディアを与えることを意図したものであり、本開示の範囲をいかようにも限定するものではない。
本開示の一部の態様において、ここに記載される機構は、以下に限られないが、クラウドベースのサーバ、モバイル装置、仮想現実システム、拡張現実システム、ヘッドアップディスプレイ装置、ヘルメット搭載ディスプレイ装置、CAVE型システム、壁サイズのディスプレイ、ビデオゲーム装置、ディスプレイ装置、メディアプレーヤ、メディアサーバ、メディア生産システム、カメラシステム、ホームベースのシステム、通信装置、映像処理システム、ビデオコーデックシステム、スタジオシステム、ストリーミングサーバ、クラウドベースのコンテンツサービスシステム、ハンドヘルド装置、ゲーム機、テレビジョン、シネマディスプレイ、ラップトップコンピュータ、ネットブックコンピュータ、タブレットコンピュータ、携帯無線電話、電子書籍リーダ、POS端末、デスクトップコンピュータ、コンピュータワークステーション、コンピュータサーバ、コンピュータキオスク、又は他の様々な種類の端末及び媒体処理ユニットのいずれか1つ以上を含む、媒体処理システムの一部を形成する。説明を容易にするために、ここに提示するシステム例の一部又は全てを、そのコンポーネント部分の各々の単一の例を用いて示す。一部の例は、システムの全てのコンポーネントを説明又は図示しないことがある。本開示の他の態様は、示されるコンポーネントの各々をより多く又はより少なく含むことができ、幾つかのコンポーネントを組み合わせてもよく、あるいは追加の又は代わりのコンポーネントを含んでもよい。
映像配信処理パイプラインの例
図1Aは、映像キャプチャから映像コンテンツ表示までの様々な段階を示す、映像配信パイプライン100Aのプロセスの一例を示している。画像生成ブロック105を用いて、映像フレーム102のシーケンスがキャプチャ又は生成される。映像フレーム102は、(例えば、デジタル・カメラによって)デジタル的にキャプチャされて、あるいは(例えば、コンピュータアニメーションを用いて)コンピュータによって生成されて、映像データ107を提供し得る。あるいは、映像フレーム102は、フィルムカメラによってフィルム上にキャプチャされてもよい。フィルムがデジタルフォーマットに変換されて、映像データ107を提供する。制作フェーズ110にて、映像データ107が編集されて、映像制作ストリーム112を提供する。
次いで、制作ストリーム112の映像データが、制作後の編集のために、ブロック115にてプロセッサに提供される。ブロック115の制作後編集は、映像制作者の創作意図に従って画像の質を高めたり特定の見た目の画像を達成したりするために、映像の特定の領域内の色又は輝度を調整又は修正することを含み得る。これは、“カラータイミング”又は“カラーグレーディング”と呼ばれることもある。他の編集(例えば、シーン選択及びシーケンス化、画像クロッピング、コンピュータ生成した視覚的特殊効果の付加など)をブロック115で実行してもよく、配信のための最終版の制作物117を産み出すことができる。制作後編集115の間、参照ディスプレイ125上でビデオ画像が眺められる。
ポスト制作115に続いて、最終制作物117の映像データが、例えばテレビジョンセット、セットトップボックス、映画館などの復号再生へのダウンストリーム配信のために、符号化ブロック120に送達され得る。一部の態様において、符号化ブロック120は、符号化ビットストリーム122を生成するために、例えばATSC、DVB、DVD、Blu-Ray(登録商標)、及び他の配信フォーマットによって定義されるものなどの、オーディオビデオエンコーダを含み得る。受信器にて、符号化ビットストリーム122が復号ユニット130によって復号されて、信号117と同一もの又はそれをよく近似したものを表す復号信号132を生成する。受信器は、参照ディスプレイ125とは全く異なる特性を持ち得るターゲットディスプレイ140に取り付けられることがある。その場合、ディスプレイ管理ブロック135を使用して、ディスプレイマッピングされた信号137を生成することによって、復号信号132のダイナミックレンジをターゲットディスプレイ140の特性にマッピングし得る。
加えて、オプションで、あるいは代わりに、符号化ビットストリーム122は更に、画像メタデータとともに符号化され、画像メタデータは、以下に限られないが、HDRディスプレイ装置上でのレンダリングに最適化され得るターゲットHDR画像と同じ又はそれを近似するバックワードリシェイピング画像を生成するため、信号117に対してバックワードリシェイピングを実行するためにダウンストリームデコーダによって使用されることができるバックワードリシェイピングメタデータを含む。本開示の一部の態様において、ターゲットHDR画像は、逆トーンマッピング、逆ディスプレイ管理などを実行する1つ以上の変換ツールを用いて、信号117から生成され得る。
本開示の一部の態様において、ターゲットHDR画像は、制作後編集115にて映像データ112から直接生成され得る。制作後編集115の間、ターゲットHDR画像は、ターゲットHDR画像に対する制作後編集処理を実行している同一の又は異なるカラリストによって、高ダイナミックレンジをサポートする第2の参照ディスプレイ(図示せず)上で眺められる。
信号リシェイピング
現在、例えばシリアルデジタルインタフェース(SDI)などの映像配信用の多くのデジタルインタフェースは、成分当たり12ビット/ピクセルに制限されている。さらに、例えばH.264(又はAVC)及びH.265(又はHEVC)などの多くの圧縮標準は、成分当たり10ビット/ピクセルに制限されている。従って、既存のインフラストラクチャ及び圧縮標準内で、約0.001-10,000cd/m(又はニット)のダイナミックレンジを持つHDRコンテンツをサポートするには、効率的な符号化及び/又は量子化が必要とされる。
ここで使用される用語“PQ”は、知覚的輝度振幅量子化を指す。人間の視覚系は、増加する光レベルに対して非常に非線形に応答する。刺激を見る人間の能力は、その刺激の輝度、刺激の大きさ、刺激を構成する空間周波数、及び刺激を見ている特定の瞬間において眼が適応している輝度レベルによって影響される。本開示の態様において、知覚量子化関数は、線形の入力グレーレベルを、人間の視覚系におけるコントラスト感度閾値により良く一致する出力グレーレベルにマッピングする。一例のPQマッピング関数が、SMPTE ST 2084:2014“High Dynamic Range EOTF of Mastering Reference Displays”(それをその全体にてここに援用する)に記載されており、そこでは、一定の刺激サイズを所与として、全ての輝度レベル(すなわち、刺激レベル)について、その輝度レベルでの最小の視認可能なコントラストステップが、最も感度の高い順応レベル及び最も感度の高い空間周波数(HVSモデルに従う)に従って選択される。伝統的なガンマ曲線(これは、例えば、物理的陰極線管(CRT)装置の応答曲線を表し、同時に人間の視覚系の応答の仕方と非常におおまかな類似性を持つ)と比較して、PQ曲線は、比較的単純な関数モデルを用いて、人間の視覚系の真の視覚応答を模倣する。
図1Bは、本開示の一態様に従ったコンテンツ適応リシェイピングのためのプロセス100Bの一例を示している。図1Aと比較して、同じ参照符号を与えたアイテムは同じ要素を指し得る。入力フレーム117を所与として、フォワードリシェイピングブロック150が、入力及び符号化制約を分析し、入力フレーム117を再量子化出力フレーム152にマッピングするコードワードマッピング関数を生成する。例えば、入力117が、特定のEOTFに従ってガンマ符号化又はPQ符号化され得る。本開示の一部の態様において、リシェイピングプロセスに関する情報は、メタデータを使用して、ダウンストリーム装置(例えばデコーダなど)に通信され得る。符号化120に続いて、復号130におけるフレームが、例えば前述のディスプレイ管理プロセス135などの更なるダウンストリーム処理のために、フレーム122をEOTFドメイン(例えば、ガンマ又はPQ)に変換し戻すものであるバックワードリシェイピング関数によって処理され得る。
上述のように、バックワードリシェイピング関数は理想的には、生成されたバックワードリシェイピング画像が、ディスプレイ装置上でのレンダリングに最適化され得るターゲット(例えば、HDR)画像と同じ又はそれを近似するように構成される。換言すれば、ディスプレイ装置上に生成される画像の品質は、バックワードリシェイピング関数の精度に依存する。
バックワードリシェイピング最適化 ― 最小平均二乗誤差予測子
以下のセクションでは、バックワードリシェイピング関数の最適化を説明する。図1Aのシステムにおいて、累積密度関数(cumulative density function;CDF)マッチングを利用してルマ信号チャネル予測子を構築する。その全体にてここに援用する米国特許第10,264,287号に記載されているように、1つ以上のSDR画像におけるSDRコードワードの分布から生成されるSDRヒストグラムに基づいて、SDR CDFが構築される。同様に、上記1つ以上のSDR画像に対応する1つ以上のHDR画像におけるHDRコードワードの分布から生成されるHDRヒストグラムに基づいて、HDR CDFが構築される。次いで、SDR CDF及びHDR CDFに基づいてヒストグラム伝達関数が生成される。そして、バックワードリシェイピング関数を決定するために、ヒストグラム伝達関数を用いて、バックワードリシェイピングメタデータが決定され得る。
クロマチャネル情報がルマチャネルと干渉するとき、CDFに誤差が生じ得る。従って、各輝度範囲に対する予測誤差(平均二乗誤差又はMSEに関して)を最小化するために、最小化平均二乗誤差(MMSE)予測子が使用され得る。
MMSE予測子はMSEに関しての1つのソリューションであるが、この予測子は単調非減少特性を保証するものではない。非単調非減少特性によって生み出されるアーチファクトを回避するために、MMSE予測子に対するCDFマッチングを介して、単調非減少特性が強制される。曲線が滑らかであることを保証すべく、最終的な曲線平滑化も適用される。
先ず、ソース信号をsijと定義し、参照信号をrと定義する(iはフレームインデックスjのピクセル位置)とともに、ソース信号及び参照信号のビット深度をそれぞれBとBと定義して、各ソース信号ビンbに対して、同じソース信号ビンからマッピングされた参照信号の平均値が、ビンb内の値(Φと表す)を持つソース信号のセットを見つけることによって見出される。限定ではなく一例として、ビンの個数は、信号内の総コードワード(例えば、2Bs)として設定し得るが、他の実施形態では、計算上の複雑さを低減させるために、より少ない数のビンを選択してもよい。
Figure 2022542312000002
を所与として、平均値は、
Figure 2022542312000003
として表される。
マッピングtb,j=f MMSE(b)がMMSE予測子である。得られるMMSE予測の一例(200A)を図2Aに示す。
バックワードリシェイピング最適化 ― 単調非減少
MMSE予測子が単独で使用される場合、マッピングは単調非減少ではない。図2Aに示されるように、より大きいビンインデックスを有する一部のビンが、より小さいビンインデックスからのものよりも小さいマッピング値を持つ。換言すれば、単調非減少でない曲線では、2つのビンについて
Figure 2022542312000004
を観察することができる。
(上記の特性が生み出す)アーチファクトを回避するために、単調非減少(monotonically non-decreasing;MND)曲線は、全てのビンに対して、
Figure 2022542312000005
という特性を持つべきである。
米国特許第10,264,278号に記載されているように、CDFマッチングは、SDRヒストグラムに基づく累積密度関数(CDF)及びHDRヒストグラムに基づくCDFを利用することによって、バックワードリシェイピング関数(又はBLUT)を生成する。一実施形態において、CDFを構築するために、ソース信号のSDRヒストグラムをなおも使用し得るが、式(2)のMMSE予測関数を使用してHDR CDFを構築し得る。例えば、SDRヒストグラムを所与として、ヒストグラム伝達関数を決定するために、SDRヒストグラムの各要素が、MMSE予測関数を用いてHDRヒストグラムにマッピングされる。2つのヒストグラムを所与として、CDFの構築及びCDFマッチングアルゴリズムの残りの部分は、米国特許第10,264,278号と同様のままである。このCDFマッチングアルゴリズムからの出力BLUTも、式(4)のMND特性を満足することになる。
最終的なマッピングテーブル:
Figure 2022542312000006
を用いて、(図2Aに示す曲線に)MNDを適用した後、得られる曲線を図2Bのグラフ200Bに示す。
バックワードリシェイピング最適化 ― 曲線平滑化
CDFマッチングはMNDを保証し得るが、マッピング関数は、8ピースの2次多項式で近似されることができるように十分に滑らかである必要がある。従って、この曲線に、以下のように平滑化フィルタが適用される。
先ず、コードワードbの移動平均の上限及び下限(それぞれ、bu及びbl)が設定され、ここで、nは全体のフィルタタップの半分である。
Figure 2022542312000007
次いで、第1の移動平均が適用される:
Figure 2022542312000008
次いで、第2の移動平均が適用される:
Figure 2022542312000009
なお、nの値は、10ビット信号に対して4とし得る。図2Cに示すように、結果として得られるグラフ200Cに示す曲線は、先の図2Bの曲線よりも滑らかであり、8ピースの2次多項式を用いてそれをモデル化することを容易にする。
MMSE予測子は、フォワードリシェイピング又はバックワードリシェイピングのいずれかの経路に適用され得る。MMSE予測子はまた、単にHLGからPQではなく、多様なEOTFに適用され得る。
バックワードリシェイピング最適化 ― BLUT類似性加重平滑化
シーン内の連続した映像フレームにおける突然の意図しない強度変化/目に見えるフラッシングを防止するために、各映像フレームに対するルマバックワードリシェイピング関数を時間ドメインで平滑化する必要がある。シーンカットを意識したバックワードルックアップテーブル(backward look up table;BLUT)平滑化を用いて、フラッシングを緩和することができる。しかしながら、自動シーンカット検出器の不完全さのために、自動検出されたシーンカットの瞬間に、目に見えるフラッシング問題がなおも発生することがある。従って、誤ったシーンカット検出の影響を受けない平滑化機構が必要である。隣接するBLUTの差異は既に異なるコンテンツを指し示すので、ここに記載されるプロセスは、類似の形状を有するBLUTを平均化し、類似しない傾向を有するBLUTを除外する。換言すれば、BLUT類似性加重平均を利用して、この一時的な安定性問題を解決する。
をフレームjの非平滑化BLUTであると定義し、フレームjのb番目のSDRルマコードワードにおける正規化されたHDRコードワード値をT と定義する。SDRコードワードの総数はNである。Tを平滑化するための中心フレームjの各側に(合計で2M+1フレームとなる)Mフレームの対称ウィンドウ([j-M,j+M])を考え、フレームjの平滑化出力BLUTを:
Figure 2022542312000010
とする。
整数m∈[j-M,j+M]とし、各j番目のフレームに対する各SDRコードワードbにおける正規化された二乗差に関して、BLUT類似性が測定される。jの位置になる中心フレームに対してm番目のフレームのBLUTに対するb番目のコードワードにおけるBLUT類似性を、βj,m として定義すると、得られる定義は:
Figure 2022542312000011
であり、言及しておけばβj,j =0である。
コンテンツ依存重み付け係数α が、BLUT類似性に対する乗数として使用され、各b番目のコードワードに対して、j番目のフレームのSDR画像ヒストグラムh によって、次のように決定される:
Figure 2022542312000012
上の例において、ヒストグラム値の範囲を、各コードワードにおける実際のピクセル数よりも小さくするために、ヒストグラムの対数をとる。対数をとる際に1を加えることで、如何なるヒストグラムでも重み付け係数が有限にとどまることが保証される。
j番目のフレームのBLUTを平滑化するため、各m番目のフレームの重みが使用され、ここで、mはその時間的近傍[j-M,j+M]からのものである。この重みは、例えば、ヒストグラム及びBLUT差の両方に基づく指数項又はガウシアン項として計算され得る。j番目のフレームBLUTを平滑化するためのm番目のフレームBLUTの重みwj,mは:
Figure 2022542312000013
として計算され、ここで、γは平滑化が適切に作用するように経験的に決定される定数(例えば、130)である。従って、この重みはフレームに特有であり、そのフレーム内の全てのコードワードに対して同じである。m∈[j-M,j+M]であるような各T への乗数として重みwj,mを用いて、中心フレームjの平滑BLUTが:
Figure 2022542312000014
として計算される。
一部の態様において、12フレーム(M=12)がBLUT平滑化に使用される。結果として得られたj番目のフレームのBLUTが、次の曲線フィッティングのプロセスに使用される。
多変量多重回帰(Multivariate-Multi-Regression;MMR)最適化
映像処理においては、複数のカラーチャネルMMR予測子を使用することがあり、これは、第1のダイナミックレンジの入力信号が、それに対応する第2のダイナミックレンジのエンハンストダイナミックレンジ信号と、多変量MMR演算子とを用いて予測されることを可能にする(例えば、その全体にてここに援用する米国特許第8,811,490号に記載されている予測子)。得られたデータを、バックワードリシェイピング関数の決定に利用することができる。以下、MMR予測子に関する予測パラメータ(MMR係数)を選択するプロセスを説明する。カラーマッピングペアが各ピクセルから又は3Dマッピングテーブルとして収集された後、MMR係数が最小二乗法によって解かれる。ソース画像から参照画像へのマッピングが、次のように表され:
Figure 2022542312000015
ここで、s ,s C0、及びs C1は、それぞれ、マッピングテーブル内のk番目のエントリのプレーンY、C、及びCのソース値を表し、r ,r C0、及びr C1は、それぞれ、マッピングテーブル内のk番目のエントリのプレーンY、C、及びCの参照マッピング値を表す。なお、Kは、マッピングテーブル内のエントリの総数である。
平均参照クロマ値を用いて2つのベクトルが構築される。
Figure 2022542312000016
ソース値を用いて行列が構築され、
Figure 2022542312000017
ここで、p =[1 s C0 C1 C0 C1 C0 C1 …]は、MMR予測子によってサポートされる全ての項を含む。
MMRは、以下の最適化問題を解くことによって計算され:
Figure 2022542312000018
ここで、xC0及びxC0は、それぞれ、C及びCに関するMMR係数である。
Figure 2022542312000019
と表記して、線形問題:
Figure 2022542312000020
を解くことによってMMR係数を計算することができる。
A行列が非正則(singular)に近い(上の線形問題が悪条件(ill-conditioned)である)場合、問題が生じ得る。悪条件の問題に対して安定した解を得るために、以下が適用され得る。
多変量多重回帰最適化 ― ガウス消去法
MMR係数は、
Figure 2022542312000021
により解くことができる。しかし、Aの逆行列を計算することは時間を消費し得る。1つの解決策はガウス消去法を適用することである。
ガウス消去法において、A行列は上三角形の形態に変換される。次いで、MMR係数を解くために逆置換が適用される。A行列の一部の行が一部の他の行の線形結合に近いとき、A行列は非正則に近い。これが意味することは、対応する(1つ以上の)MMR項が一部の他のMMR項と線形に相関しているということである。これらの項を削除することは、問題がより条件の良いものにし、より安定な解を生じさせることになる。
MMR項の総数をPとして、行列A、ベクトルbC0及びbC1を、以下に示すように表記する。
Figure 2022542312000022
説明を容易にするため、以下のプロセスをCに関して説明する。なお、Cも同様に処理し得る。続く消去を、次の行列を参照して説明する:
Figure 2022542312000023
表1に詳述されているように、εは小さい閾値であるとして、|am,m|≦εである場合、行m及び列mは無視されることになり、これはm番目のMMR項(例えば、集合x C0=0)及び連立方程式からのm番目の方程式を除去することと等価であり、そうでない場合には、解法はその行の残りを除去することに進む。一部の態様において、所定の閾値εは約1e-6である。次いで、所定の閾値εを用いてMMR係数を計算するために、上の式(22)のxC0を解くべく逆置換が適用される。従って、有意なMMR項を用いて線形問題A xC0=bC0及びA xC1=bC1が解かれる一方で、有意でない項の係数はゼロとなる。上述のガウス消去プロセスの間にMMR項の線形相関が除去され、解を比較的安定なものにする。擬似コードでのプロセスの一例を表1に示す。
Figure 2022542312000024
Figure 2022542312000025
EOTF変換 ― フルデータポイント最適化
図3Aは、図6を参照して更に詳細に後述するものであるコントローラ600によって実装されるEOTF変換プロセスを示すプロセス図300Aである。以下では、図300Aを、映像変換(特に、第1のEOTFから別のEOTFへの変換)用のバックワードリシェイピング関数を決定するための方法400を示すフローチャートである図4に関連して説明する。以下の節では、ハイブリッド対数ガンマ(Hybrid Log-Gamma;HLG)信号から知覚量子化器(Perceptual Quantizer;PQ)信号への(特に、1,000ニットでのHLG Rec.2020から1,000ニットでのPQ Rec.2020への)EOTF変換の一例を記載することとする。しかしながら、理解されるべきことには、当該システムは必ずしも、これらの特定のタイプの信号間の変換に限定されるわけではない。
先ず、ブロック410にて、コントローラ600は、カラーグリッドからの合成データ(例えば、受信した映像データ)から第1組(第1のセット)のサンプルポイントを決定する。特に、合成データ(例えば、図1Aの映像117)から、図3AにΦとして表す一組のサンプルポイント(ピクセル)が収集される。この文書において、用語“サンプルポイント”及び“サンプルピクセル”は、同じものを指し示すように交換可能に使用される。一組のサンプルポイントΦは、最初に、M個のサンプルを有する1Dサンプリング配列qを構築することによって定められ、iはピクセル位置を示すとして、正規化ドメインでのi番目のポイント(i∈[0,M-1])が以下のように示される。
Figure 2022542312000026
次いで、1D配列qを用いて、3D空間における3Dサンプルポイント(以下では3D配列qijkと表記する)を構築し、ここで、j及びkは、それぞれ、ピクセルのフレームインデックス及び深度である。
Figure 2022542312000027
従って、一組のサンプルポイントΦは、3D空間内で収集されたサンプルポイント{qijk}である。
図4に戻るに、ブロック415にて、コントローラ600は、一組のサンプルポイントから、第1の色空間の第1の色表現における第1の電気-光伝達関数に従った第1組のサンプルポイントを画定する。例えば、ブロック302(図3A)にて、一組のサンプルポイントΦは、Rec.2020色空間(RGB)における電気-光伝達関数HLG 1000ニットに従って扱われ(又は定義され)、それをΦHLG,RGB,R2020と表記する。なお、Φの中の値はここでは変更されない。図4のブロック420にて、プロセッサ600は、第1の電気-光伝達関数に従った第1組のサンプルポイントを、マッピング関数を介して、第1の色空間の第1の色表現における第2の電気-光伝達関数に変換して、第2の電気-光伝達関数に従った第2組のサンプルポイントを生成する。例えば、図3Aのブロック304に示すように、一組のサンプルポイントΦHLG,RGB,R2020が、ITU-R BT.2100を介して、Rec.2020 PQ 1000ニットRGBポイントに変換され、その結果をΦPQ,RGB,R2020と表記する(ブロック306)。
一部の態様において、ブロック425にて、コントローラ600は、第1の電気-光伝達関数に従った第1組のサンプルピクセル(ポイント)及び第2の電気-光伝達関数に従った第2組のサンプルピクセル(ポイント)を、第1の色空間の第2の色表現に変換する。例えば、本例において、バックワードリシェイピング関数を得るために、サンプルポイントが、同じ色空間Rec.2020内で、RGB色表現からYCbCr色表現に変換される。ここで、一組の処理されたサンプルピクセル(ポイント)ΦHLG,RGB,R2020及びΦPQ,RGB,R2020の両方が、第1の色表現RGBから、同じ色空間Rec.2020の第2の色表現YCbCrに変換される(それぞれ、図3Aのブロック308及び310)。一組のサンプルピクセル(ポイント)ΦHLG,RGB,R2020に対して、Rec.2020 HLG YCbCrピクセル(ポイント)が、
Figure 2022542312000028
として定義され、一組のサンプルピクセル(ポイント)全体がΦHLG,YCbCr,R2020として定義される(ブロック312)。
一組の処理されたサンプルポイントΦPQ,RGB,R2020に対して、Rec.2020 PQ YCbCrポイントが、
Figure 2022542312000029
として定義され、一組のサンプルポイント全体がΦPQ,YCbCr,R2020として定義される(図3Aのブロック314)。
バックワードリシェイピング関数式が、次のように定義され:
Figure 2022542312000030
ここで、
Figure 2022542312000031
は、各HLGピクセルの予測PQ値である。
図4に戻るに、ブロック430にて、コントローラ600は、第1の電気-光伝達関数に従った変換された第1組のサンプルピクセル(ポイント)と、第2の電気-光伝達関数に従った変換された第2組のサンプルピクセル(ポイント)とに基づいて、バックワードリシェイピング関数を決定する。本例では、バックワードリシェイピング関数式を求めるために、以下の最適化問題が解かれる(ブロック316)。
Figure 2022542312000032
最適化の式(31)は、式(30)のサンプルバックワードリシェイピング関数から得られる結果(変換された第1組のサンプルピクセル内のピクセルにサンプルバックワードリシェイピング関数を適用することによって得られる予測PQ値)と、第2の電気-光伝達関数に従った第2組のサンプルポイント(29)内のピクセルとの間の差を最小化するように、サンプルバックワードリシェイピング関数を繰り返し適用及び調整することによる段階的アプローチにて解かれ得る。上述のように、本開示の一部の態様によれば、バックワードリシェイピング関数は多項式関数とし得る。従って、上で説明した方法は、例えばエンコーダ側でフル変換を実行することなく、HLG系とPQ系との間での変換を近似することを可能にする。上のプロセスを用いると、いくらかの予測誤差が存在し得ることが分かる。
EOTF変換 ― 一般使用データポイント最適化
以下に説明する方法及びプロセスは、Rec.2020色空間の内部の小さい範囲を利用することによって、上述したバックワードリシェイピング関数決定の精度を改善するための一ソリューションを提供する。図3Bは、コントローラ600(図6)によって実装される改良EOTF変換プロセスを示すプロセス図300Bである。なお、プロセス図300Bは、プロセス図300Aにおけるものと同様のステップ/ブロックを含んでおり、従って、同じラベル(特に、ブロック302、304、306、308、310、312、314、及び316)を付している。
図3Bに示す例では、受信したソースデータから一組のサンプルポイントを決定することに続いて、第1の色空間の第1の電気-光伝達関数に従った第1組のサンプルポイントの生成は更に、ブロック318にて、一組のサンプルポイントから、第2の色空間(ここでは、PQ 1000ニットRec.709 RGB)の第1の色表現における第3の電気-光伝達関数に従った第3組のサンプルポイントを生成し、第3の電気-光伝達関数に従った第3組のサンプルポイントに基づいて、第1の電気-光伝達関数に従った第1組のサンプルピクセルを生成することを含み、第2の色空間は第1の色空間よりも小さい。図3Bに示す例では、第2の色空間の第1の色表現における第3の電気-光伝達関数をΦPQ,RGB,R709と表記する。上述のように、第2の色空間は第1の色空間よりも小さい。第2の色空間は、受信したデータの視覚的コンテンツに基づいて決定又は選択され得る。例えば、本例において、データは自然シーンのものとし得る。従って、Rec.709が選択されるのは、何故なら、例えばRec.2020などの高精細度標準の色空間よりは小さいものの、Rec.709は自然シーンに必要な色の大部分を含むからである。特定のシーンにおいて通常使用される色を含んだ、より小さい色空間を使用することにより、ピクセル値の変換を近似するために予測子を使用するときに非線形性が低減され、予測誤差が低減され得る。
ブロック320にて、コントローラ600は、第2の色空間の第1の色表現における第3の電気-光伝達関数を、第1の色空間の第1の色表現における第1の電気-光伝達関数のコンテナに変換して、ブロック302の、第1の電気-光伝達関数に従った第1組のサンプルピクセル(ポイント)を生成する。本例では、第1組のサンプルポイントによって定義される第1の色空間の第1の色表現におけるコンテナは、Rec.2020 HLG RGBであり、得られる一組のサンプルピクセル(ポイント)をΦHLG,RGB,R2020と表記する(図3Bのブロック302)。そして、ブロック302における信号は、図3Aの方法300Aの対応するブロック(ブロック304、306、308、310、312、314、及び316)と同様に処理される。
本開示の一部の態様において、より広い色空間にデータを含めるために、コントローラ600は、第1の電気-光伝達関数に従った第1組のサンプルポイントを画定する際に、第2の色空間の第3の電気-光伝達関数に従った第3組のサンプルポイント、及び(後述する)第3の色空間の第1の色表現における第4の電気-光伝達関数に従った第4組のサンプルポイントを補間し得る。結果として得られる第1の電気-光伝達関数に従った第1組のサンプルポイントは、故に、第2の色空間の第3の電気-光伝達関数に従った第3組のサンプルポイントと、第3の色空間の第4の電気-光伝達関数に従った第4組のサンプルポイントと、の重み付けた組み合わせを含む。なお、この補間は、第3組のサンプルポイント及び第4組のサンプルポイントの両方を、共通の色空間の共通の電気-光伝達関数に変換することを含む。
例えば、本例では、Rec.709及びRec.2020からサンプルポイントが補間され得る。図3Cは、コントローラ600(図6)によって実装される(補間を利用する)改良EOTF変換プロセスを示している。なお、プロセス図300Cは、プロセス図300Aにおけるものと同様のステップ/ブロックを含んでおり、従って、同じラベル(特に、ブロック302、304、306、308、310、312、314、及び316)を付している。なお、また、ブロック322及び324(並びに326及び328)で実行されるプロセスは、図3Bの方法300Bのブロック318及び320で実行されるプロセスと同様である。
ブロック322にて、コントローラ600は、図3Bのブロック318と同様に、Rec.709 PQ 1000ニットRGBにおいてなどで一組のサンプルポイントΦを、Φ PQ,RGB,R709(第2の色空間の第3の電気-光伝達関数に従った第3組のサンプルポイント)として画定する。次いで、ブロック324にて、コントローラ600は、第3組のサンプルポイントΦを、Φ HLG,RGB,R2020としてRec.2020 HLGコンテナに変換する。次いで、ブロック326にて、映像データの元のサンプルポイントΦの複製が、Rec.2020 PQ 1000ニットRGB色空間においてなどでΦ PQ,RGB,R2020(第3の色空間の第4の電気-光伝達関数に従った第4組のサンプルポイント)として画定される。次いで、ブロック328にて、セットΦ PQ,RGB,R2020が、Φ HLG,RGB,R2020としてRec.2020 HLGコンテナに(例えば、第3組のサンプルの共通色空間Rec.2020の第1色表現(RGB)のコンテナに)変換される。ブロック330にて、コントローラ600は、全てのカラーチャネル内のデータポイントを、
Figure 2022542312000033
のように重み付けて結合する。
上の式(32)から得られたHLGセットΦHLG,RGB,R2020(ブロック302)が、次いで、Rec.2020 PQ 1000ニットRGBポイント(ブロック304)に変換され、得られたセットをΦPQ,RGB,R2020(ブロック306)と表記する。次いで、ブロック308及び310にて、それぞれ、セットΦHLG,RGB,R2020及びΦPQ,RGB,R2020が、同じ色空間Rec.2020の第2の色表現YCbCrに変換され、得られたセットが、ブロック316にて、バックワードリシェイピング関数を計算するために使用される。
信号適法化
上述の方法を更に改善するため、信号適法化関数/プロセスが実装され得る。例えば、後述するように、所定の範囲に適合するように入力を変更するように構成された信号適法化関数が、第1組のサンプルポイントΦに適用され得る。信号適法化は、望ましい法定範囲内に入るように範囲外の入力信号を補正することである。パイプライン(例えば、図1Aのパイプライン100A)が処理中に範囲外の信号を映像データに導入することがあり、それが、最終的な映像信号に望ましくないアーチファクトをもたらし得る。後述するように、本開示の一部の態様において、信号適法化関数はハードクリッピングを実装する。本開示の一部の態様において、信号適法化関数は区分線形関数である。本開示の一部の態様において、信号適法化関数はS字曲線である。
信号適法化 ― 入力信号適法化
ハードクリッピング法(所望範囲外の信号をクリッピングする)を用いて入力信号適法化が実装されることがある。実装するのは簡単であるが、最終的な視覚生成物は不十分であり得る。これを解決するために、法定範囲の境界付近でのソフトクリッピング又は段階的遷移が適用され得る。
1つの方法は区分線形適法化を適用することである。区分線形適法化は、中間範囲で入力と適法化後の信号との間の線形関係を維持し、合法/非合法境界近くの信号に圧縮をかける。先ず、入力範囲を[x,x]と定義し、ピボット点を[xp1,xp2]と定義し、適法化関数をf pwl()と定義すると、対応する適法化後の値は:
Figure 2022542312000034
となる。
区分の式は、
Figure 2022542312000035
として表され得る。
図5Aは、入力範囲が[x,x]=[-0.2,1.2]であり且つピボット点が[xp1,xp2]=[0.2,0.8]である場合の、上の区分の式のプロット500Aである。プロット500Aから見て取れるように、ピボット点502A及び502Bに一次の不連続性があり、これがグローバルなモデル問題を引き起こし得る。これは、次式:
Figure 2022542312000036
によって特徴付けられ得るものであるS字曲線で区分線形を近似することによって解決され得る。
上の変数a、a、a、及びaは4パラメータモデルを表す。所与の区分モデルfLpwl(x)を用い、非線形最適化を介してこれらのパラメータが計算され得る。図5Bは、所与の区分パラメータ[x,x]=[-0.2,1.2]及び[xp1,xp2]=[0.2,0.8]による近似S字曲線(以下のパラメータ)のプロット500Bを示している。
Figure 2022542312000037
EOTF変換 ― 信号適法化
上の技術を用いて、図3Aの方法300A(並びに図3B及び3Cそれぞれの方法300B及び300C)は、信号適法化を組み込むように更に改良され得る。図3Dは、コントローラ600(図6)によって実装される改良EOTF変換プロセス(信号適法化を利用する)を示している。上述のEOTF変換と同様に、一組のサンプルポイントΦが収集される(式(1)及び(2)に関して上述したように)。このサンプルポイントのセットが、非合法入力信号(ブロック332)として画定される。次に、コントローラ600は、各サンプルポイントqに適法化関数(上の式(37)及び(38)それぞれのf pwl(x)又はf sgm(x)のいずれか)を適用すること(ブロック334)によって、対応する適法化後のセットを構築して、適法化後の値q (ブロック336)を作り出す。
Figure 2022542312000038
次式:
Figure 2022542312000039
を用い、上の1D配列を使って3D空間における3Dサンプルポイントを構築する。
収集された適法化後のポイント{q ijk}をセットΦと表記する。
バックワードリシェイピング関数を得るために、ブロック308にて、セットΦのサンプルポイントがRec.2020 HLG YCbCrポイントにおいて、
Figure 2022542312000040
として画定され、変換されたセットをΦin,YCbCr,R2020と表記する。
ブロック310にて、適法化後のセットΦのサンプルポイントがRec.2020 PQ YCbCrにおいて、
Figure 2022542312000041
として画定され、変換された適法化後のセットをΦlg,YCbCr,R2020と表記する。
次いで、入力非合法信号Φin,YCbCr,R2020から合法信号Φlg,YCbCr,R2020へのバックワードリシェイピング関数が計算される(ブロック316)。図3Aに関して上述したブロック316と同様に、バックワードリシェイピング関数式は、
Figure 2022542312000042
のように定義され、ここで、
Figure 2022542312000043
は予測値である。
バックワードリシェイピング関数式を求めるために、以下の最適化問題:
Figure 2022542312000044
が解かれる(ブロック316)。
ハードウェアデバイス例
図6は、本開示の一部の態様に従ったコントローラ600のブロック図である。コントローラ600は、ターゲットディスプレイ上に映像をレンダリングするためのバックワードリシェイピング関数を生成する上述の装置とし得る。コントローラ600は、電子プロセッサ605、メモリ610、及び入力/出力インタフェース615を含む。電子プロセッサ605は、例えば、図4を参照して説明した方法を実行するように構成され得る。電子プロセッサ605は、(例えば、メモリ610及び/又は入力/出力インタフェース615から)情報を取得及び提供し、例えばメモリ610のランダムアクセスメモリ(“RAM”)領域又はメモリ610の読み出し専用メモリ(“ROM”)又は他の非一時的コンピュータ読み取り可能媒体(図示せず)に格納されることが可能な1つ以上のソフトウェア命令又はモジュールを実行することによって情報を処理する。ソフトウェアは、ファームウェア、1つ以上のアプリケーション、プログラムデータ、フィルタ、ルール、1つ以上のプログラムモジュール、及び他の実行可能な命令を含むことができる。電子プロセッサ605は、複数のコア又は個々の処理ユニットを含んでいてもよい。電子プロセッサ605は、とりわけ、ここに記載された制御プロセス及び方法に関係するソフトウェアを、メモリ610から取り出して実行するように構成される。
メモリ610は、1つ以上の非一時的コンピュータ読み取り可能媒体を含むことができ、プログラム記憶領域及びデータ記憶領域を含む。プログラム記憶領域及びデータ記憶領域は、ここに記載されるように、異なるタイプのメモリの組み合わせを含むことができる。メモリ610は、任意の非一時的コンピュータ読み取り可能媒体の形態をとり得る。
入力/出力インタフェース615は、入力を受信し、システム出力を提供するように構成される。入力/出力インタフェース615は、例えば制作後115の映像データソース(図1A)といった、コントローラ600の内部及び外部の両方のデバイスから情報及び信号を取得し、それらのデバイスに情報及び信号を(例えば、1つ以上の有線及び/又は無線接続上で)提供する。コントローラ600は、エンコーダ、デコーダ、又は両方を含むことができ、あるいはそれとして機能するように構成されることができる。
等物、拡張、代替、及び寄せ集め
以上の明細書において、本開示の特定の態様を説明してきた。しかしながら、当業者が理解することには、以下の請求項に記載される開示の範囲から逸脱することなく、様々な変更及び変形を行うことができる。従って、明細書及び図面は、限定的な意味ではなく例示的な意味で見られるべきであり、そのような変更の全てが本教示の範囲に含まれることが意図される。
ここに記載されたプロセス、システム、方法、発見的方法などに関して、理解されるべきことには、かかるプロセスのステップなどを特定の順序付けられたシーケンスに従って起こるように記載してきたが、かかるプロセスは、記載のステップをここに記載の順序以外の順序で実行して実施されてもよいものである。さらに理解されるべきことには、特定の複数のステップを同時に実行したり、他のステップを追加したり、ここに記載された特定のステップを省略したりしてもよい。換言すれば、ここでのプロセスの説明は、特定の態様を例示する目的で提供されており、決して請求項を限定するように解釈されるべきではない。
さらに、この文書において、例えば第1及び第2、上及び下、並びにこれらに類するものなどの関係用語は、単に、1つのエンティティ又はアクションを別のエンティティ又はアクションから区別するためのみに使用されていることがあり、必ずしもそのようなエンティティ又はアクションの間の実際のそのような関係又は順序を要求したり意味したりしているわけではない。用語“有する”、“有している”、“持つ”、“持っている”、“含む”、“含んでいる”、“含有する”、“含有している”、又はこれらの任意の他のバリエーションは、非排他的な包含に及ぶことを意図しており、要素のリストを有する、持つ、含む、包含するプロセス、方法、物品、又は装置は、それらの要素のみを含むのではなく、明示的に列挙されていない他の要素、又はそのようなプロセス、方法、物品、又は装置に生来的な他の要素を含み得る。“comprises …a”、“has …a”、“includes …a”、“contains …a”によって始まる要素は、更なる制約なしに、当該要素を有する、持つ、含む、包含するプロセス、方法、物品、又は装置における更なる同じ要素の存在を排除しない。用語“a”及び“an”は、ここで別のことが明示的に記載されていない限り、1つ以上として定義される。用語“実質的に”、“本質的に”、“近似的に”、“約”、又はこれらの任意の他のバージョンは、当業者によって理解されるのと近いものとして定義され、該用語は、本開示の態様において10%以内、5%以内、1%以内、又は0.5%以内であると定義され得る。ここで使用される用語“結合される”は、接続されるとして定義されるが、必ずしも直接的にではなく、また、必ずしも機械的にではない。ある特定のやり方で“構成”される装置又は構造は、少なくともそのやり方で構成されるが、列挙されないやり方でも構成され得る。
理解されることには、本開示の一部の態様は、例えばマイクロプロセッサ、デジタル信号プロセッサ、カスタマイズされたプロセッサ、及びフィールドプログラマブルゲートアレイ(FPGA)などの、一般的な又は特殊化されたプロセッサ(又は“処理デバイス”)と、ここに記載される方法及び/又は装置の機能の一部、大部分、又は全てを特定の非プロセッサ回路と共に実装するように1つ以上のプロセッサを制御する特有の格納プログラム命令(ソフトウェア及びファームウェアの両方を含む)とで構成され得る。あるいは、一部の又は全ての機能が、格納プログラム命令を持たない状態マシンによって実装されたり、それら機能の各機能又は特定の機能の組み合わせがカスタムロジック論理として実装される1つ以上の特定用途向け集積回路(ASIC)にて実装されたりしてもよい。当然ながら、これら2つのアプローチの組み合わせを用いてもよい。
さらに、本開示は、ここに記載されて特許請求される方法を実行するようにコンピュータ(例えば、プロセッサを有する)をプログラミングするためのコンピュータ読み取り可能コードを格納したコンピュータ読み取り可能記憶媒体として実装されることができる。このようなコンピュータ読み取り可能記憶媒体の例は、以下に限られないが、ハードディスク、CD-ROM、光記憶装置、磁気記憶装置、ROM(読み出し専用メモリ)、PROM(プログラム可能読み出し専用メモリ)、EPROM(消去可能プログラム可能読み出し専用メモリ)、EEPROM(電気的消去可能プログラム可能読み出し専用メモリ)、及びフラッシュメモリを含む。また、予期されることには、例えば利用可能な時間、現行技術、及び経済的考慮によって多大な努力及び数多くの設計選択が動機付けら得るにもかかわらず、当業者は、ここに開示された概念及び原理によって導かれるとき、そのようなソフトウェア命令及びプログラム並びにICを、最小限の実験で容易に生成することが可能となる。
請求項で使用される用語は全て、そうでないことの明示的な指し示しがここで行われていない限り、それらの最も広い合理的な構成及びここに記載される技術の当業者によって理解される通常の意味を与えることが意図される。特に、例えば“a”、“the”、“said”などの単数形の冠詞の使用は、そうでないことの明示的な限定を請求項が記載していない限り、1つ以上の指し示される要素を記載しているように読まれるべきである。
本開示の様々な態様は、以下の例示的な構成のうちのいずれか1つ以上をとり得る:
(1) 高ダイナミックレンジ映像データを生成する装置であって、メモリと、電子プロセッサとを有する。前記電子プロセッサは、合成されたデータから一組のサンプルポイントを決定し、前記一組のサンプルポイントから、第1の色空間の第1の電気-光伝達関数に従った第1組のサンプルポイントを画定し、前記第1の電気-光伝達関数に従った前記第1組のサンプルポイントを、マッピング関数を介して第2の電気-光伝達関数に変換して、前記第2の電気-光伝達関数に従った第2組のサンプルポイントを生成し、前記第1の電気-光伝達関数に従った前記第1組のサンプルポイント及び前記第2の電気-光伝達関数に従った第2組のサンプルポイントに基づいてバックワードリシェイピング関数を決定する、ように構成される。
(2) 前記電子プロセッサは、サンプルバックワードリシェイピング関数の結果と前記第2の電気-光伝達関数に従った前記第2組のサンプルポイントとの間の差を最小化するように、前記サンプルバックワードリシェイピング関数を繰り返し適用及び調整することによって、前記バックワードリシェイピング関数を決定するように構成される、(1)の装置。
(3) 前記第1の電気-光伝達関数に従った前記第1組のサンプルポイントを、前記マッピング関数を介して、前記第2の電気-光伝達関数に変換することは、前記第1の電気-光伝達関数に従った前記第1組のサンプルポイントに信号適法化関数を適用することを含む、(1)又は(2)の装置。
(4) 前記第1の電気-光伝達関数はハイブリッド対数ガンマである、(1)乃至(3)のいずれか一の装置。
(5) 前記第2の電気-光伝達関数は知覚量子化器である(1)乃至(4)のいずれか一の装置。
(6) 前記第1の電気-光伝達関数に従った前記第1組のサンプルポイントを画定することは、前記一組のデータポイントから、第2の色空間の第3の電気-光伝達関数に従った第3組のサンプルピクセルを生成し、前記第2の色空間の前記第3の電気-光伝達関数に従った前記第3組のサンプルポイントに基づいて、前記第1の電気-光伝達関数に従った前記第1組のサンプルポイントを生成し、前記第2の色空間は前記第1の色空間よりも小さい、ことを含む、(1)乃至(5)のいずれか一の装置。
(7) 前記第1の電気-光伝達関数に従った前記第1組のサンプルポイントを画定することは、前記第2の色空間の前記第3の電気-光伝達関数に従った前記第3組のサンプルポイントと、第3の色空間の第4の電気-光伝達関数に従った第4組のサンプルポイントとを補間して、前記第1の電気-光伝達関数に従った前記第1組のサンプルポイントが、前記第2の色空間の前記第3の電気-光伝達関数に従った前記第3組のサンプルポイントと、前記第3の色空間の前記第4の電気-光伝達関数に従った前記第4組のサンプルポイントとの、重み付けた組み合わせを含むようにすることを含み、補間することは、前記第3組のサンプルポイント及び前記第4組のサンプルポイントが共通の色空間の共通の電気-光伝達関数に変換されることを含む(6)の装置。
(8) 前記電子プロセッサは更に、最小平均二乗誤差予測子からのバックワードリシェイピング関数データに基づいて、前記バックワードリシェイピング関数を決定するように構成される、(1)乃至(7)のいずれか一の装置。
(9) 前記最小平均二乗誤差予測子の複数のパラメータが、マルチチャネル多重回帰モデルに基づいて決定される、(8)の装置。
(10) 前記電子プロセッサは更に、平滑化された等重量バックワードルックアップテーブルに基づいて前記バックワードリシェイピング関数を決定するように構成される、(1)乃至(9)のいずれか一の装置。
(11) 当該装置はエンコーダである、(1)乃至(10)のいずれか一の装置。
(12) 第1の電気-光伝達関数に対応する信号を第2の電気-光伝達関数に対応する信号に変換する方法であって、合成されたデータから一組のサンプルポイントを決定し、前記一組のサンプルポイントから、第1の色空間の第1の電気-光伝達関数に従った第1組のサンプルポイントを画定し、前記第1の電気-光伝達関数に従った前記第1組のサンプルポイントを、マッピング関数を介して第2の電気-光伝達関数に変換して、前記第2の電気-光伝達関数に従った第2組のサンプルポイントを生成し、前記第1の電気-光伝達関数に従った前記第1組のサンプルポイント及び前記第2の電気-光伝達関数に従った第2組のサンプルポイントに基づいてバックワードリシェイピング関数を決定する、ことを有する方法。
(13) 前記バックワードリシェイピング関数を決定することは、サンプルバックワードリシェイピング関数の結果と前記第2の電気-光伝達関数に従った前記第2組のサンプルポイントとの間の差を最小化するように、前記サンプルバックワードリシェイピング関数を繰り返し適用及び調整することを含む、(12)の方法。
(14) 前記第1の電気-光伝達関数に従った前記第1組のサンプルポイントを、前記マッピング関数を介して、前記第2の電気-光伝達関数に変換することは、前記第1の電気-光伝達関数に従った前記第1組のサンプルポイントに信号適法化関数を適用することを含む、(12)又は(13)の方法。
(15) 前記信号適法化関数はハードクリッピングを実行する、(14)の方法。
(16) 前記信号適法化関数は区分線形関数である、(14)の方法。
(17) 前記信号適法化関数はS字曲線である、(14)の方法。
(18) 前記第1の電気-光伝達関数はハイブリッド対数ガンマである、(12)乃至(17)のいずれか一の方法。
(19) 前記第2の電気-光伝達関数は知覚量子化器である、(12)乃至(18)のいずれか一の方法。
(20) 前記第1の電気-光伝達関数に従った前記第1組のサンプルポイントを画定することは、前記一組のデータポイントから、第2の色空間の第3の電気-光伝達関数に従った第3組のサンプルピクセルを生成し、前記第2の色空間の前記第3の電気-光伝達関数に従った前記第3組のサンプルポイントに基づいて、前記第1の電気-光伝達関数に従った前記第1組のサンプルポイントを生成し、前記第2の色空間は前記第1の色空間よりも小さい、ことを含む、(12)乃至(19)のいずれか一の方法。
(21) 前記第1の電気-光伝達関数に従った前記第1組のサンプルポイントを画定することは、前記第2の色空間の前記第3の電気-光伝達関数に従った前記第3組のサンプルポイントと、第3の色空間の第4の電気-光伝達関数に従った第4組のサンプルポイントとを補間して、前記第1の電気-光伝達関数に従った前記第1組のサンプルポイントが、前記第2の色空間の前記第3の電気-光伝達関数に従った前記第3組のサンプルポイントと、前記第3の色空間の前記第4の電気-光伝達関数に従った前記第4組のサンプルポイントとの、重み付けた組み合わせを含むようにすることを含み、補間することは、前記第3組のサンプルポイント及び前記第4組のサンプルポイントが共通の色空間の共通の電気-光伝達関数に変換されることを含む(20)の方法。
(22) 前記バックワードリシェイピング関数は、最小平均二乗誤差予測子からのバックワードリシェイピング関数データに基づいて決定される関数である、(12)乃至(21)のいずれか一の方法。
(23) 前記最小平均二乗誤差予測子の複数のパラメータが、マルチチャネル多重回帰モデルに基づいて決定される、(22)の方法。
(24) 前記マルチチャネル多重回帰(MMR)モデルの解を計算することは、ガウス消去法を用いて、MMRモデルにおける悪条件(ill condition)を減らすことを有する、(23)の方法。
(25) 前記バックワードリシェイピング関数を決定することは、平滑化された等重量バックワードルックアップテーブルに基づく、(12)乃至(24)のいずれか一の方法。
(26) 命令を格納した非一時的なコンピュータ読み取り可能媒体であって、前記命令は、コンピュータのプロセッサによって実行されるときに、前記コンピュータに(12)乃至(25)のいずれか一の方法を実行させる、非一時的なコンピュータ読み取り可能媒体。
本発明の様々な態様が、以下の列挙実施形態例(enumerated example embodiment;EEE)から理解され得る:
1. 高ダイナミックレンジ映像データを生成する装置であって、
メモリと、
電子プロセッサと、
を有し、
前記電子プロセッサは、
合成されたデータから一組のサンプルポイントを決定し、
前記一組のサンプルポイントから、第1の色空間の第1の電気-光伝達関数に従った第1組のサンプルポイントを画定し、
前記第1の電気-光伝達関数に従った前記第1組のサンプルポイントを、マッピング関数を介して第2の電気-光伝達関数に変換して、前記第2の電気-光伝達関数に従った第2組のサンプルポイントを生成し、
前記第1の電気-光伝達関数に従った前記第1組のサンプルポイント及び前記第2の電気-光伝達関数に従った第2組のサンプルポイントに基づいてバックワードリシェイピング関数を決定する、
ように構成される、
装置。
2. 前記電子プロセッサは、サンプルバックワードリシェイピング関数の結果と前記第2の電気-光伝達関数に従った前記第2組のサンプルポイントとの間の差を最小化するように、前記サンプルバックワードリシェイピング関数を繰り返し適用及び調整することによって、前記バックワードリシェイピング関数を決定するように構成される、EEE1の装置。
3. 前記第1の電気-光伝達関数に従った前記第1組のサンプルポイントを、前記マッピング関数を介して、前記第2の電気-光伝達関数に変換することは、前記第1の電気-光伝達関数に従った前記第1組のサンプルポイントに、所定の範囲に適合するように入力を修正するように構成された信号適法化関数を適用することを含む、EEE1又は2の装置。
4. 前記第1の電気-光伝達関数はハイブリッド対数ガンマである、EEE1乃至3のいずれか一の装置。
5. 前記第2の電気-光伝達関数は知覚量子化器である、EEE1乃至4のいずれか一の装置。
6. 前記第1の電気-光伝達関数に従った前記第1組のサンプルポイントを画定することは、
前記一組のデータポイントから、第2の色空間の第3の電気-光伝達関数に従った第3組のサンプルピクセルを生成し、
前記第2の色空間の前記第3の電気-光伝達関数に従った前記第3組のサンプルポイントに基づいて、前記第1の電気-光伝達関数に従った前記第1組のサンプルポイントを生成し、前記第2の色空間は前記第1の色空間よりも小さい、
ことを含む、EEE1乃至5のいずれか一の装置。
7. 前記第1の電気-光伝達関数に従った前記第1組のサンプルポイントを画定することは、前記第2の色空間の前記第3の電気-光伝達関数に従った前記第3組のサンプルポイントと、第3の色空間の第4の電気-光伝達関数に従った第4組のサンプルポイントとを補間して、前記第1の電気-光伝達関数に従った前記第1組のサンプルポイントが、前記第2の色空間の前記第3の電気-光伝達関数に従った前記第3組のサンプルポイントと、前記第3の色空間の前記第4の電気-光伝達関数に従った前記第4組のサンプルポイントとの、重み付けた組み合わせを含むようにすることを含み、補間することは、前記第3組のサンプルポイント及び前記第4組のサンプルポイントが共通の色空間の共通の電気-光伝達関数に変換されることを含むEEE6の装置。
8. 前記電子プロセッサは更に、最小平均二乗誤差予測子からのバックワードリシェイピング関数データに基づいて、前記バックワードリシェイピング関数を決定するように構成される、EEE1乃至7のいずれか一の装置。
9. 当該装置はエンコーダである、EEE1乃至8のいずれか一の装置。
10. 第1の電気-光伝達関数に対応する信号を第2の電気-光伝達関数に対応する信号に変換する方法であって、
合成されたデータから一組のサンプルポイントを決定し、
前記一組のサンプルポイントから、第1の色空間の第1の電気-光伝達関数に従った第1組のサンプルポイントを画定し、
前記第1の電気-光伝達関数に従った前記第1組のサンプルポイントを、マッピング関数を介して第2の電気-光伝達関数に変換して、前記第2の電気-光伝達関数に従った第2組のサンプルポイントを生成し、
前記第1の電気-光伝達関数に従った前記第1組のサンプルポイント及び前記第2の電気-光伝達関数に従った第2組のサンプルポイントに基づいてバックワードリシェイピング関数を決定する、
ことを有する方法。
11. 前記バックワードリシェイピング関数を決定することは、サンプルバックワードリシェイピング関数の結果と前記第2の電気-光伝達関数に従った前記第2組のサンプルポイントとの間の差を最小化するように、前記サンプルバックワードリシェイピング関数を繰り返し適用及び調整することを含む、EEE10の方法。
12. 前記第1の電気-光伝達関数に従った前記第1組のサンプルポイントを、前記マッピング関数を介して、前記第2の電気-光伝達関数に変換することは、前記第1の電気-光伝達関数に従った前記第1組のサンプルポイントに、所定の範囲に適合するように入力を修正するように構成された信号適法化関数を適用することを含む、EEE10又は11の方法。
13. 前記信号適法化関数はハードクリッピングを実行する、EEE12の方法。
14. 前記信号適法化関数は区分線形関数である、EEE12又は13の方法。
15. 前記信号適法化関数はS字曲線である、EEE12又は13の方法。
16. 前記第1の電気-光伝達関数はハイブリッド対数ガンマである、EEE10乃至15のいずれか一の方法。
17. 前記第2の電気-光伝達関数は知覚量子化器である、EEE10乃至16のいずれか一の方法。
18. 前記第1の電気-光伝達関数に従った前記第1組のサンプルポイントを画定することは、
前記一組のデータポイントから、第2の色空間の第3の電気-光伝達関数に従った第3組のサンプルピクセルを生成し、
前記第2の色空間の前記第3の電気-光伝達関数に従った前記第3組のサンプルポイントに基づいて、前記第1の電気-光伝達関数に従った前記第1組のサンプルポイントを生成し、前記第2の色空間は前記第1の色空間よりも小さい、
ことを含む、EEE10乃至17のいずれか一の方法。
19. 前記第1の電気-光伝達関数に従った前記第1組のサンプルポイントを画定することは、前記第2の色空間の前記第3の電気-光伝達関数に従った前記第3組のサンプルポイントと、第3の色空間の第4の電気-光伝達関数に従った第4組のサンプルポイントとを補間して、前記第1の電気-光伝達関数に従った前記第1組のサンプルポイントが、前記第2の色空間の前記第3の電気-光伝達関数に従った前記第3組のサンプルポイントと、前記第3の色空間の前記第4の電気-光伝達関数に従った前記第4組のサンプルポイントとの、重み付けた組み合わせを含むようにすることを含み、補間することは、前記第3組のサンプルポイント及び前記第4組のサンプルポイントが共通の色空間の共通の電気-光伝達関数に変換されることを含むEEE18の方法。
20. 前記バックワードリシェイピング関数は、最小平均二乗誤差予測子からのバックワードリシェイピング関数データに基づいて決定される関数である、EEE10乃至19のいずれか一の方法。
21. 命令を格納した非一時的なコンピュータ読み取り可能媒体であって、前記命令は、コンピュータのプロセッサによって実行されるときに、前記コンピュータにEEE10乃至20のいずれか一の方法を実行させる、非一時的なコンピュータ読み取り可能媒体。

Claims (29)

  1. バックワードリシェイピング関数を決定する装置であって、
    電子プロセッサであり、
    受信した映像データから一組のサンプルピクセルを決定し、
    前記一組のサンプルピクセルから、第1の色空間の第1の色表現における第1の電気-光伝達関数に従った第1組のサンプルピクセルを画定し、
    前記第1の電気-光伝達関数に従った前記第1組のサンプルピクセルを、マッピング関数を介して、前記第1の色空間の前記第1の色表現における第2の電気-光伝達関数に変換して、前記第1組のサンプルピクセルから前記第2の電気-光伝達関数に従った第2組のサンプルピクセルを生成し、
    前記第1組のサンプルピクセル及び前記第2組のサンプルピクセルを、前記第1の色表現から前記第1の色空間の第2の色表現に変換し、
    前記変換した第1組のサンプルピクセル及び前記変換した第2組のサンプルピクセルに基づいてバックワードリシェイピング関数を決定する、
    ように構成された電子プロセッサ、
    を有し、
    前記電子プロセッサは、前記変換した第1組のサンプルピクセル内のピクセルにサンプルバックワードリシェイピング関数を適用することによって得られる予測ピクセル値と、前記変換した第2組のサンプルピクセル内のピクセルと、の間の差を最小化するように、前記サンプルバックワードリシェイピング関数を繰り返し適用及び調整することによって、前記バックワードリシェイピング関数を決定するように構成される、
    装置。
  2. 前記受信した映像データは、第1のダイナミックレンジでの1つ以上の第1の画像を有し、前記第2組のサンプルピクセルは、第2のダイナミックレンジでの1つ以上の第2の画像に属し、前記第1のダイナミックレンジは前記第2のダイナミックレンジよりも低く、前記電子プロセッサは更に、
    - 前記1つ以上の第1の画像内の第1の分布をしたコードワードから生成される第1のヒストグラムに基づく第1の累積密度関数と、
    - 前記1つ以上の第2の画像内の第2の分布をしたコードワードから生成される第2のヒストグラムに基づく第2の累積密度関数と、
    - 前記バックワードリシェイピング関数を決定するための、前記第1の累積密度関数及び前記第2の累積密度関数に基づくヒストグラム伝達関数と、
    を決定するように構成される、
    請求項1に記載の装置。
  3. 前記電子プロセッサは更に、平均二乗誤差を最小化するための予測子を適用することによって前記予測値を決定するように構成される、請求項1又は2に記載の装置。
  4. 前記電子プロセッサは更に、平均二乗誤差を最小化するための予測子を適用することによって前記予測値を決定するように構成され、
    前記電子プロセッサは、前記予測子を使用して、前記第1の分布をしたコードワードからの各コードワードを前記第2の分布をしたコードワードにマッピングして、前記ヒストグラム伝達関数を決定するように構成される、請求項2に記載の装置。
  5. 最小平均二乗誤差の予測子の複数のパラメータが、マルチチャネル多重回帰モデルに基づいて決定される、請求項3に記載の装置。
  6. 前記バックワードリシェイピング関数はルミナンスバックワードリシェイピング関数である、請求項2乃至4のいずれかに記載の装置。
  7. 前記バックワードリシェイピング関数はクロマバックワードリシェイピング関数である、請求項5に記載の装置。
  8. 前記電子プロセッサは更に、平滑化された等重量バックワードルックアップテーブルに基づいて前記バックワードリシェイピング関数を決定するように構成される、請求項1乃至7のいずれかに記載の装置。
  9. 前記電子プロセッサは、前記一組のサンプルピクセルを3次元ピクセルアレイのサンプルピクセルqijkとして決定するように構成され、iは、M個のサンプル有する対応する1次元ピクセルアレイqのピクセル位置を示し、j及びkは、フレームインデックス及びピクセルの深さである、請求項1乃至8のいずれかに記載の装置。
  10. 前記第1の電気-光伝達関数に従った前記第1組のサンプルピクセルを、前記マッピング関数を介して、前記第2の電気-光伝達関数に変換することは、前記第1組のサンプルピクセルの範囲が所定の範囲内であることを強制するために、前記第1組のサンプルピクセルに信号適法化関数を適用することを含む、請求項1乃至9のいずれかに記載の装置。
  11. 前記信号適法化関数は、
    - 前記第1組のうち前記所定の範囲の外側にあるサンプルピクセルをクリッピングすることを有するクリッピング関数、
    - 区分線形関数、又は
    - S字曲線関数、
    のうちの1つである、請求項10に記載の装置。
  12. 前記第1の電気-光伝達関数はハイブリッド対数ガンマである、請求項1乃至11のいずれか一項に記載の装置。
  13. 前記第2の電気-光伝達関数は知覚量子化器である、請求項1乃至12のいずれか一項に記載の装置。
  14. 前記第1の電気-光伝達関数に従った前記第1組のサンプルピクセルを画定することは、
    前記一組のサンプルピクセルから、第2の色空間の前記第1の色表現における第3の電気-光伝達関数に従った第3組のサンプルピクセルを生成し、
    前記第2の色空間の前記第3の電気-光伝達関数に従った前記第3組のサンプルピクセルに基づいて、前記第1の電気-光伝達関数に従った前記第1組のサンプルピクセルを生成し、前記第2の色空間は前記第1の色空間よりも小さい、
    ことを含む、請求項1乃至13のいずれか一項に記載の装置。
  15. 前記第1の電気-光伝達関数に従った前記第1組のサンプルピクセルを画定することは、
    前記第2の色空間の前記第1の色表現における前記第3の電気-光伝達関数に従った前記第3組のサンプルピクセルと、第3の色空間の前記第1の色表現における第4の電気-光伝達関数に従った第4組のサンプルピクセルとを補間して、前記第1の電気-光伝達関数に従った前記第1組のサンプルピクセルが、前記第2の色空間の前記第3の電気-光伝達関数に従った前記第3組のサンプルピクセルと、前記第3の色空間の前記第4の電気-光伝達関数に従った前記第4組のサンプルピクセルとの、重み付けた組み合わせを含むようにする、
    ことを含む、請求項14に記載の装置。
  16. 前記電子プロセッサは、前記第2の色空間の前記第1の色表現における前記第3の電気-光伝達関数を、前記第1の色空間の前記第1の色表現における前記第1の電気-光伝達関数のコンテナに変換するように構成される、請求項14又は15に記載の装置。
  17. 前記電子プロセッサは、前記第3の色空間の前記第4の電気-光伝達関数を、前記第1の色空間の前記第1の色表現における前記第1の電気-光伝達関数のコンテナに変換するように構成される、請求項15又は16に記載の装置。
  18. 当該装置はエンコーダ又はデコーダである、請求項1乃至17のいずれか一項に記載の装置。
  19. バックワードリシェイピング関数を決定する方法であって、
    受信した映像データから一組のサンプルピクセルを決定し、
    前記一組のサンプルピクセルから、第1の色空間の第1の色表現における第1の電気-光伝達関数に従った第1組のサンプルピクセルを画定し、
    前記第1の電気-光伝達関数に従った前記第1組のサンプルピクセルを、マッピング関数を介して、前記第1の色空間の前記第1の色表現における第2の電気-光伝達関数に変換して、前記第1組のサンプルピクセルから前記第2の電気-光伝達関数に従った第2組のサンプルピクセルを生成し、
    前記第1組のサンプルピクセル及び前記第2組のサンプルピクセルを、前記第1の色表現から前記第1の色空間の第2の色表現に変換し、
    前記変換した第1組のサンプルピクセル及び前記変換した第2組のサンプルピクセルに基づいてバックワードリシェイピング関数を決定する、
    ことを有し、
    前記バックワードリシェイピング関数を決定することは、前記変換した第1組のサンプルピクセル内のピクセルにサンプルバックワードリシェイピング関数を適用することによって得られる予測ピクセル値と、前記変換した第2組のサンプルピクセル内のピクセルと、の間の差を最小化するように、前記サンプルバックワードリシェイピング関数を繰り返し適用及び調整することを含む、
    方法。
  20. 前記第1の電気-光伝達関数に従った前記第1組のサンプルピクセルを、前記マッピング関数を介して、前記第2の電気-光伝達関数に変換することは、前記第1組のサンプルピクセルの範囲が所定の範囲内であることを強制するために、前記第1組のサンプルピクセルに信号適法化関数を適用することを含む、請求項19に記載の方法。
  21. 前記信号適法化関数は、
    - 前記第1組のうち前記所定の範囲の外側にあるサンプルピクセルをクリッピングすることを有するクリッピング関数、
    - 区分線形関数、又は
    - S字曲線関数、
    のうちの1つである、請求項20に記載の方法。
  22. 前記第1の電気-光伝達関数はハイブリッド対数ガンマである、請求項19乃至21のいずれか一項に記載の方法。
  23. 前記第2の電気-光伝達関数は知覚量子化器である、請求項19乃至21のいずれか一項に記載の方法。
  24. 前記第1の電気-光伝達関数に従った前記第1組のサンプルピクセルを画定することは、
    前記一組のサンプルピクセルから、第2の色空間の前記第1の色表現における第3の電気-光伝達関数に従った第3組のサンプルピクセルを生成し、
    前記第2の色空間の前記第3の電気-光伝達関数に従った前記第3組のサンプルピクセルに基づいて、前記第1の電気-光伝達関数に従った前記第1組のサンプルピクセルを生成し、前記第2の色空間は前記第1の色空間よりも小さい、
    ことを含む、請求項19乃至23のいずれか一項に記載の方法。
  25. 前記第1の電気-光伝達関数に従った前記第1組のサンプルピクセルを画定することは、
    前記第2の色空間の前記第1の色表現における前記第3の電気-光伝達関数に従った前記第3組のサンプルピクセルと、第3の色空間の前記第1の色表現における第4の電気-光伝達関数に従った第4組のサンプルピクセルとを補間して、前記第1の電気-光伝達関数に従った前記第1組のサンプルピクセルが、前記第2の色空間の前記第3の電気-光伝達関数に従った前記第3組のサンプルピクセルと、前記第3の色空間の前記第4の電気-光伝達関数に従った前記第4組のサンプルピクセルとの、重み付けた組み合わせを含むようにする、
    ことを含む、請求項24に記載の方法。
  26. 前記第2の色空間の前記第1の色表現における前記第3の電気-光伝達関数を、前記第1の色空間の前記第1の色表現における前記第1の電気-光伝達関数のコンテナに変換する、ことを更に有する請求項24又は25に記載の方法。
  27. 前記第3の色空間の前記第4の電気-光伝達関数を、前記第1の色空間の前記第1の色表現における前記第1の電気-光伝達関数のコンテナに変換する、ことを更に有する請求項25又は26に記載の方法。
  28. 前記サンプルバックワードリシェイピング関数の前記予測値は、平均二乗誤差を最小化するための予測子を適用することによって決定される、請求項19乃至27のいずれか一項に記載の方法。
  29. 命令を格納した非一時的なコンピュータ読み取り可能媒体であって、前記命令は、コンピュータのプロセッサによって実行されるときに、前記コンピュータに請求項19乃至28のいずれか一項に記載の方法を実行させる、非一時的なコンピュータ読み取り可能媒体。
JP2022506085A 2019-07-30 2020-07-27 電気-光伝達関数変換及び信号適法化 Active JP7574277B2 (ja)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201962880266P 2019-07-30 2019-07-30
EP19189052 2019-07-30
EP19189052.4 2019-07-30
US62/880,266 2019-07-30
PCT/US2020/043789 WO2021021762A1 (en) 2019-07-30 2020-07-27 Electro-optical transfer function conversion and signal legalization

Publications (2)

Publication Number Publication Date
JP2022542312A true JP2022542312A (ja) 2022-09-30
JP7574277B2 JP7574277B2 (ja) 2024-10-28

Family

ID=

Also Published As

Publication number Publication date
EP4005208A1 (en) 2022-06-01
BR112022001015A2 (pt) 2022-04-05
US20220295020A1 (en) 2022-09-15
US11895416B2 (en) 2024-02-06
WO2021021762A1 (en) 2021-02-04
CN114175647A (zh) 2022-03-11

Similar Documents

Publication Publication Date Title
US10701375B2 (en) Encoding and decoding reversible production-quality single-layer video signals
EP3459248B1 (en) Chroma reshaping for high dynamic range images
EP3266208B1 (en) Content-adaptive perceptual quantization for high dynamic range images
US10575028B2 (en) Coding of high dynamic range video using segment-based reshaping
US10311558B2 (en) Efficient image processing on content-adaptive PQ signal domain
US20180007356A1 (en) Reshaping curve optimization in hdr coding
EP3734588B1 (en) Color appearance preservation in video codecs
US10701359B2 (en) Real-time content-adaptive perceptual quantizer for high dynamic range images
US10750146B2 (en) High dynamic range color conversion correction
EP2774370A1 (en) Layer decomposition in hierarchical vdr coding
US8600159B2 (en) Color converting images
WO2018049335A1 (en) Coding of high dynamic range video using segment-based reshaping
JP2023544583A (ja) Sdrからhdrへのアップコンバートのための適応的ローカルリシェーピング
CN113170205A (zh) 整形函数的插值
US11895416B2 (en) Electro-optical transfer function conversion and signal legalization
JP7574277B2 (ja) 電気-光伝達関数変換及び信号適法化
WO2023096728A1 (en) Denoising for sdr-to-hdr local reshaping
JP2024505493A (ja) グローバルおよびローカル再整形を介した画像向上

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20230601

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20240626

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20240709

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20240821

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20240917