JP6495552B2 - Dynamic range coding for images and video - Google Patents

Dynamic range coding for images and video Download PDF

Info

Publication number
JP6495552B2
JP6495552B2 JP2018531233A JP2018531233A JP6495552B2 JP 6495552 B2 JP6495552 B2 JP 6495552B2 JP 2018531233 A JP2018531233 A JP 2018531233A JP 2018531233 A JP2018531233 A JP 2018531233A JP 6495552 B2 JP6495552 B2 JP 6495552B2
Authority
JP
Japan
Prior art keywords
color
image
input
hdr
linear
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2018531233A
Other languages
Japanese (ja)
Other versions
JP2019504548A (en
Inventor
ジェローン フーベルト クリストッフェル ヤコブス ステッセン
ジェローン フーベルト クリストッフェル ヤコブス ステッセン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Koninklijke Philips NV
Original Assignee
Koninklijke Philips NV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Koninklijke Philips NV filed Critical Koninklijke Philips NV
Publication of JP2019504548A publication Critical patent/JP2019504548A/en
Application granted granted Critical
Publication of JP6495552B2 publication Critical patent/JP6495552B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/50Image enhancement or restoration using two or more images, e.g. averaging or subtraction
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/90Dynamic range modification of images or parts thereof
    • G06T5/92Dynamic range modification of images or parts thereof based on global image properties
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/46Colour picture communication systems
    • H04N1/64Systems for the transmission or the storage of the colour picture signal; Details therefor, e.g. coding or decoding means therefor
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/85Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/98Adaptive-dynamic-range coding [ADRC]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N25/00Circuitry of solid-state image sensors [SSIS]; Control thereof
    • H04N25/50Control of the SSIS exposure
    • H04N25/57Control of the dynamic range
    • H04N25/571Control of the dynamic range involving a non-linear response
    • H04N25/575Control of the dynamic range involving a non-linear response with a response composed of multiple slopes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N9/00Details of colour television systems
    • H04N9/64Circuits for processing colour signals
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10016Video; Image sequence
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10024Color image
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20172Image enhancement details
    • G06T2207/20208High dynamic range [HDR] image processing

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Nonlinear Science (AREA)
  • Image Processing (AREA)
  • Processing Of Color Television Signals (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Description

本発明は、第1の輝度ダイナミックレンジの画像又は画像のビデオを第2の輝度ダイナミックレンジ(以下の実施形態の大部分では、符号化側では入力画像の第1のレンジより低く、復号側ではより高い)の画像又はビデオに変換することを可能にする装置及び方法並びにその結果得られる製品、たとえば、データ記憶製品(たとえば、ブルーレイディスク)又は伝送製品又は信号に関し、特には、マスター高ダイナミックレンジ(HDR:high dynamic range)画像(たとえば、1000nitピーク明度、すなわち、関連する基準ディスプレイのピーク明度)から開始し、これは非限定的には、たとえば、カラーグレーダによって定義される特定のカラールックで作成されるマスターHDRグレーディング、又は放送の準備ができたRAWテレビ番組キャプチャであり、次いで、第2のダイナミックレンジの画像又は特に画像のセット(ビデオ)を介した符号化及び通信があり、これは入力マスターとは別のダイナミックレンジで符号化され、たとえば典型的には、標準ダイナミックレンジ画像(SDR:standard dynamic range、これはレガシーなRec.709のOETFで定義され、100nitピーク明度(PB:peak brightness)の基準モニタ上で最適に見えるようにグレーディングされる)として符号化され、又は任意のLDR(低ダイナミックレンジ:low dynamic range)画像符号化であり、任意の画像通信システムの他方側で、対応する画像又はビデオ復号器が、たとえば、受信側で利用可能な3000nitPBのHDRディスプレイ上でレンダリングするのに適した復号画像を生成する。方法及び装置の実施形態は、レガシー(LDR)ビデオ符号化(本文書では標準SDR符号化とも呼ばれる)よりも高い輝度要件に対処できる必要がある任意のビデオ符号化及び復号に特に適している。SDR(LDR)ビデオ符号化は典型的にはRec.709のEOTFで符号化され、これは100nitの標準値付近のピーク明度及び0.1nitの黒レベルを有する典型的なLDR表示能力にうまく一致するものであり、LDRグレーディングがこれらの標準値で行われると仮定する。高ダイナミックレンジ画像は、レガシーSDR符号化のみでは符号化できない任意の画像であり(ただし、以下に説明されるように、ツール及び装置の一部は適所で再利用される)、その理由は、典型的にはより高い画質特性を有し、特に画像のピーク明度がより高いためである(100nitよりも少なくとも2倍高いが、典型的なより高品質のHDR画像では、たとえば1000nitPB、又は5000nitPBなどである)。輝度ダイナミックレンジの下端のさらなる詳細について言及しない場合、少なくとも本出願の実施形態を理解するために、当業者がそれを0nitと仮定すると暗黙的に仮定する。   The present invention applies an image or video of a first luminance dynamic range to a second luminance dynamic range (in the majority of the following embodiments, the encoding side is lower than the first range of the input image and the decoding side With regard to the apparatus and method and the resulting product, eg a data storage product (eg Blu-ray disc) or transmission product or signal, which makes it possible to convert it into a higher) image or video, in particular the master high dynamic range (HDR: high dynamic range) image (eg, 1000 nit peak brightness, ie, the peak brightness of the associated reference display), which is not limited to a specific color look, eg, defined by a color grader Master HDR grading created or broadcast Ready RAW TV program capture, then encoding and communication via a second dynamic range image, or in particular a set of images (video), which is encoded in a different dynamic range than the input master Standard dynamic range image (SDR: standard dynamic range, which is defined in the legacy Rec. 709 OETF and looks optimal on a 100 nit peak brightness (PB) reference monitor) Or any LDR (low dynamic range) image coding, and on the other side of any image communication system, a corresponding image or video decoder, for example, On the receiving side Generate a decoded image suitable for rendering on an available 3000 nit PB HDR display. Embodiments of the method and apparatus are particularly suitable for any video encoding and decoding that needs to be able to handle higher luminance requirements than legacy (LDR) video encoding (also referred to as standard SDR encoding in this document). SDR (LDR) video coding is typically performed in Rec. Encoded with 709 EOTF, which is in good agreement with typical LDR display capabilities with peak brightness around 100 nits standard value and black level of 0.1 nit, and LDR grading is performed at these standard values. Assume that A high dynamic range image is any image that cannot be encoded with legacy SDR encoding alone (although some of the tools and equipment are reused in place, as explained below) because Typically because of higher image quality characteristics, especially because of the higher peak brightness of the image (at least twice as high as 100 nits, but typically higher quality HDR images such as 1000 nitPB or 5000 nitPB) Is). If no further details of the lower end of the luminance dynamic range are mentioned, at least in order to understand the embodiments of the present application, it is implicitly assumed by those skilled in the art to assume it 0 nits.

近年、いくつかの大きく異なるディスプレイ、具体的には、大きく異なるピーク明度を有するテレビ信号受信ディスプレイ(テレビ)が市場に登場している。従来、いわゆるレガシー低ダイナミックレンジ(LDR)ディスプレイのピーク明度(PB)は最大でも約2倍しか変わらなかったが(80〜150nitのどこか)、さらに高いピーク明度への近年の傾向は、1000nit以上のいわゆる高ダイナミックレンジ(HDR)テレビ、及び5000nitPBのディスプレイをもたらし、そのようなより高いPBの様々なディスプレイがまもなく市場に出てくると想定される。映画館でさえも、近年、視聴者に知覚される最終的な明度ダイナミックレンジを増加させる手法を検討している。100nitのLDR標準レガシーTVと比較して、たとえば2000nitのディスプレイは20倍のピーク明度を有し、これは利用可能な4以上の追加ストップに相当し、すなわち、様々な画像においてより明るい物体をレンダリングするより多数の手法に相当する。一方、新世代のHDR画像生成又は撮影システムも使用する場合、これはHDRシーン又はエフェクトのはるかに優れたレンダリングを可能にする。たとえば、(レガシーLDRグレーディングで行われるように)建物又は車両の外の晴れた世界を(ソフト)クリップする代わりに、HDR TVガマットの輝度軸上の追加の利用可能な明度を使用して、明るくカラフルな屋外エリアを表示することができる。これが意味するのは、コンテンツクリエータは、非限定的にカラーグレーダと呼ぶが(ただし、様々な態様で具現化され、たとえば生テレビ制作では、特に符号化のいくつかの色特性に影響する1つのダイヤルを時折調整するだけの場合がある人物)、非常に美しい(典型的にはより明るい、場合によってはよりコントラストが高く、よりカラフルな)専用のHDR画像又はビデオコンテンツを作る余地があるということである。しかしながら、他方でこれは問題を生じさせ、LDR画像符号化は、白から開始して相対的に設計され、18%の反射の中間グレーに従って良好に照明され、これが意味するのは、典型的には、100nitなどの比較的低いPBの5%未満のディスプレイにレンダリングされた輝度が、典型的には視聴者には、暗いグレーを識別するのが困難なものとして、又は周囲の照明に応じて識別不可能な黒としてさえ見えるということである。5000nitのディスプレイでは、この最適にグレーディングされたHDR画像に問題はなく、5000nitの5%はまだ250nitであるので、これはたとえば通常のインテリアのように見え、輝度範囲の最大95%は、たとえばランプ、又はそのようなランプに近い、すなわち明るく照らされた領域のようなHDR効果に純粋に使用することができる。しかしながら、LDRでは、このHDRグレーディングのレンダリングは完全に誤ったものとなり(そのようなディスプレイ用に作成されなかったので)、視聴者は、たとえば、黒に近い領域上の最も明るい領域に対応するホットスポットしか見えない。   In recent years, several very different displays, specifically television signal receiving displays (televisions) with significantly different peak brightness, have appeared on the market. Traditionally, the peak brightness (PB) of so-called legacy low dynamic range (LDR) displays has only changed by about twice (at somewhere between 80 and 150 nits), but the recent trend towards higher peak brightness is over 1000 nits So-called high dynamic range (HDR) televisions, and 5000 nit PB displays, and it is expected that a variety of such higher PB displays will soon be on the market. Even movie theaters are currently exploring ways to increase the final brightness dynamic range perceived by viewers. Compared to a 100 nit LDR standard legacy TV, for example a 2000 nit display has 20 times the peak brightness, which corresponds to more than 4 additional stops available, ie rendering brighter objects in various images This corresponds to a larger number of techniques. On the other hand, if a new generation HDR image generation or shooting system is also used, this allows for much better rendering of HDR scenes or effects. For example, instead of (soft) clipping the clear world outside a building or vehicle (as done in legacy LDR grading), using additional available brightness on the brightness axis of the HDR TV gamut, A colorful outdoor area can be displayed. This means that content creators are called, but not limited to, color graders (although they are embodied in various ways, for example in live television production, one that affects several color characteristics of the encoding in particular). A person who may only need to adjust the dial from time to time) and there is room to create dedicated HDR images or video content that is very beautiful (typically brighter, sometimes more contrasting and more colorful) It is. On the other hand, however, this creates a problem, and LDR image coding is relatively designed starting from white and is well illuminated according to an intermediate gray of 18% reflection, which typically means The brightness rendered on a display of less than 5% of a relatively low PB, such as 100 nits, is typically viewed by viewers as it is difficult to identify dark gray or depending on ambient lighting It can be seen as even indistinguishable black. On a 5000 nit display, there is no problem with this optimally graded HDR image, so 5% of 5000 nit is still 250 nit, so this looks like a normal interior, for example, up to 95% of the luminance range is Or purely for HDR effects such as areas that are close to such a lamp, ie brightly lit. However, in LDR, this HDR grading rendering is completely wrong (because it was not created for such a display), and viewers can, for example, hottest corresponding to the brightest area on the area close to black. I can only see the spot.

一般に、十分に異なるディスプレイ(少なくとも2倍のPBの差)に対して最適な画像を生成するためには、再グレーディングが必要である。これが行われるのは、より低いダイナミックレンジディスプレイ用の画像を再グレーディングして、より高いダイナミックレンジディスプレイ上でのレンダリングに適したものにする(すなわち、1000nitPBの実際のディスプレイ上で最適に見える、たとえば、1000nit基準ディスプレイ入力画像をアップグレードし、これは次いで5000nitPBの実際のディスプレイ上でレンダリングするために色処理される)場合と、その逆として、すなわち、画像をダウングレードして、ビデオ画像として符号化されるグレーディングに関連する基準ディスプレイよりも低いPBの実際のディスプレイ上での表示に適するようにする(その画像は典型的には何らかの手法で受信側に送信される)場合との両方である。簡潔にするため、1つ又は複数のHDR画像がLDRにダウングレードされるシナリオについてのみ説明する。   In general, regrading is necessary to produce an optimal image for sufficiently different displays (at least twice the PB difference). This is done by regrading the image for the lower dynamic range display to make it suitable for rendering on the higher dynamic range display (ie, it looks optimal on an actual display of 1000 nit PB, for example, Upgrade the 1000 nit reference display input image, which is then color processed for rendering on a 5000 nit PB actual display) and vice versa, ie downgrade the image and encode it as a video image Both to make it suitable for display on the actual display of a PB lower than the reference display associated with the grading being performed (the image is typically transmitted to the receiver in some manner). For simplicity, only scenarios where one or more HDR images are downgraded to LDR will be described.

HDR技術は(これによって意味するのは、かなり複雑な、すなわち、10000nitなどの高いピーク明度の少なくともいくつかのHDR画像を処理することが可能であるべき技術であるが、LDR画像又は中程度のダイナミックレンジ画像などでも動作する)、民生用及び業務用両方の様々な領域に浸透し(たとえば、カメラ、データ処理デバイス、たとえば、ブルーレイプレーヤー、テレビ、コンピュータソフトウェア、投影システム、セキュリティ又はビデオ会議システムなど)、様々な態様を様々な手法で処理することが可能な技術を必要とする。   HDR technology (which means that it should be able to process at least some HDR images of fairly complex, i.e. high peak brightness, such as 10000 nits, but LDR images or moderate Works with dynamic range images, etc.) and penetrates both consumer and professional areas (eg cameras, data processing devices such as Blu-ray players, televisions, computer software, projection systems, security or video conferencing systems, etc.) ), A technique capable of processing various aspects by various methods is required.

国際公開第2013/144809号(及び国際公開第2014/056679号)において、出願人は、入力画像(Im−in)に関連する基準ディスプレイダイナミックレンジとは別のディスプレイダイナミックレンジに適した画像(Im_res)を生成するための色処理を行う技法を一般的に定式化し、(典型的には、PBは異なるディスプレイダイナミックレンジ、ひいては最適にグレーディングされた画像を特徴付けるのに十分であり、その理由は、いくつかのシナリオでは、黒の点を無視し、実際的に0と仮定するためである)すなわち、これは基本的には画像が最適に見えるように作成されたディスプレイのPBを定式化し、これは以下で解明される本発明にとって改良すべき良い従来技術を形成する。この原理を図1において再び簡潔に再定式化する。しかしながら、従来技術の例の特性の一部は本実施形態の文脈において関連があり、一部は一般的なHDR符号化には存在せず、本実施形態及び教示の制限はないことを読者は理解すべきであり、その理由はそのような様々なHDRビデオ(又は画像)コーデック技術と共に動作することができるためである。   In WO 2013/144809 (and WO 2014/056679), Applicant has proposed that an image (Im_res) suitable for a display dynamic range different from the reference display dynamic range associated with the input image (Im-in). Generally formulate a technique for performing color processing to produce (typically PB is sufficient to characterize different display dynamic ranges, and thus optimally graded images, because (In some scenarios, this is for ignoring the black point and assuming it is actually zero.) That is, this basically formulates the PB of the display created so that the image looks optimal, Form a good prior art to be improved for the present invention as will be elucidated below. This principle is briefly reformulated again in FIG. However, the reader understands that some of the characteristics of the prior art examples are relevant in the context of this embodiment, some do not exist in general HDR coding, and there are no restrictions on this embodiment and teachings. It should be understood that it can work with such various HDR video (or image) codec technologies.

具体的には、関連があるのは、シーンの2つの異なるダイナミックレンジルックを有することであり、これらは色変換を介して互いに関連し得る(たとえば、図4が解明するように、街路灯の輝度、又は等価的にルマ(luma)を大幅に低下させ(これらは対応するルマを典型的には10又は12ビット表現などに符号化する符号である)、そのような高輝度画像物体全てをLDRの輝度範囲の小さいサブレンジに絞ることを選択することができる)。我々の実施形態は、マスターHDR画像の何らかの符号化を任意の受信側に送信するシステムでも動作することができるが、以下の説明では、HDR画像の代わりにLDRグレーディングを伝達する実施形態を使用し、ただし、HDRシーンのマスターHDRグレーディング画像(Im_in_HDR)の近い再構成を受信機が再計算することを可能にする色変換関数(その一部は色度平面で動作し得るが、主に輝度変換に焦点を当てる)を符号化するメタデータを共に使用することを仮定する。これは、HDR機能を有する受信機が、接続されたHDRディスプレイ上にHDR画像をレンダリングすることだけでなく、LDRテレビ又はコンピュータモニタ、プロジェクタ、ポータブルディスプレイなどをまだ有する人々のためにレガシーLDR画像をレンダリングすることも可能にする。   Specifically, what is relevant is that it has two different dynamic range looks of the scene, which can be related to each other via color conversion (eg, as shown in FIG. Significantly reduce luma, or equivalently luma (these are codes that encode the corresponding luma typically into a 10 or 12 bit representation, etc.) You can choose to focus on a sub-range that has a small luminance range for the LDR). Our embodiment can also work with systems that send some encoding of the master HDR image to any receiver, but the following description uses an embodiment that conveys LDR grading instead of the HDR image. However, a color conversion function that allows the receiver to recalculate a close reconstruction of the master HDR grading image (Im_in_HDR) of the HDR scene (some of which may operate in the chromaticity plane, but mainly luminance conversion) Let's assume that we use together the metadata that encodes. This is not only for receivers with HDR functionality to render HDR images on a connected HDR display, but also for legacy LDR images for people who still have LDR televisions or computer monitors, projectors, portable displays, etc. It can also be rendered.

この原理は一般的に適用可能(構築可能)であり、すなわち、仮定されるべきでないのは、入力画像若しくは出力画像のカラーフォーマット、又は色処理が行われる色空間に関するあらゆる特定の制限であり、具体的には、従来技術がある特定の線形RGB処理について言及する場合、本文書では、いくつかの非線形色空間処理及びそれに基づく符号化戦略を発明しており説明することを明示する。   This principle is generally applicable (constructable), ie, it should not be assumed that there are any specific restrictions on the color format of the input or output image, or the color space in which color processing is performed, Specifically, when the prior art refers to a particular linear RGB process, this document explicitly states that several non-linear color space processes and encoding strategies based thereon are invented and described.

入力画像Im_inの様々なピクセルは、色変換器100によって連続的に色処理され(ここではこれはビデオ符号化器に存在すると仮定し、符号化対象のHDRビデオを入力として取得し、LDR画像を出力するが、これは依然としてHDR情報も最適に含み、ただし、再グレーディングされたLDRルックのものである)、これは乗算器104によりそれらの線形RGB値に乗算係数(a)を乗算して、出力画像Im_res内のピクセルの出力色RsGsBsを得ることによって行われる。乗算係数は、典型的には人間のカラーグレーダによって作成されるあるトーンマッピング仕様から規定されるが、画像の特性(たとえば、ヒストグラム、又は顔のような特別な物体の色特性など)を分析する自動変換アルゴリズムから来る場合もある。マッピング関数は、たとえば、粗くガンマ状であるので、暗い色が持ち上げられ(これはLDRディスプレイ上でレンダリングするためにより明るくし、よりコントラストを高めるために必要とされる)、代償として明るい領域のコントラストが低下して、LDRディスプレイ上でパステル化される。グレーダは顔などのある特別な物体をさらに識別しており、その輝度に対して、曲線の中でコントラストが高められた部分を作成している。具体的には、この曲線は、(最大値評価ユニット101によって決定される)Mと名付けられた各ピクセルのR、G及びB色成分の最大値に、曲線適用ユニット102(これは手軽にLUTなどであって、典型的には、ガンマ係数などのマッピングの関数形状を符号化したパラメータを受信した後に、色処理を行う受信側において、たとえば画像のショットごとに計算される)によって適用されるが、Mが輝度であるか、又は輝度若しくは明度のある非線形表現、たとえばルマ、すなわち輝度の1/N乘であって、Nはある整数などである場合にも、同一の原理が動作することができる。そして、乗算係数計算ユニット103は、現在処理中のピクセルごとに、適切な乗算係数(a)を計算する。これは、たとえば、画像が第1の対象ディスプレイ、たとえば100nitLDRディスプレイ上にレンダリングされる場合、Mに適用されたトーンマッピング関数Fの出力、すなわちF(M)をMで除算したものである。たとえば800nitPBの中間ディスプレイなどのために画像が必要な場合(又は他の値、場合によっては、HDR入力画像Im_inの基準ディスプレイPBよりも高い)、(ディスプレイ上に直接レンダリングされるか、通信されるか、又は後の使用のために何らかのメモリに記憶されるかにかかわらず)画像が適合するディスプレイダイナミックレンジに適した値に、入力色の乗法マッピングの量を再スケーリングする他の関数GがF(M)/Mに適用される。これは、非常に複雑な明度変換を乗算として表現する手法である。本発明の背景知識を説明するために述べた従来技術は、典型的には線形RGB成分に乗算するものであるが、本発明の実施形態が、非線形の、たとえば典型的にはRGB色表現、たとえばRec.709のOETFで変換されたR’G’B’成分、又は典型的には1より小さい、たとえば1/2の指数値のR、G及びBのべき乘でも動作することを強調する。   The various pixels of the input image Im_in are continuously color processed by the color converter 100 (here it is assumed that it is present in the video encoder, the HDR video to be encoded is taken as input, and the LDR image is Output, which still optimally includes HDR information, but of the regraded LDR look), which is multiplied by the multiplier 104 (multiplier factor (a)) by the multiplier 104, This is done by obtaining the output color RsGsBs of the pixels in the output image Im_res. The multiplication factor is typically defined from a certain tone mapping specification created by a human color grader, but analyzes the characteristics of the image (eg, the color characteristics of a special object such as a histogram or a face). May come from automatic conversion algorithm. The mapping function is, for example, coarse and gamma-like, so dark colors are lifted (which is needed to make it brighter and more contrast to render on LDR displays), and at the cost of contrasting bright areas Is reduced and pastelized on the LDR display. Grader further identifies certain special objects, such as faces, and creates a portion of the curve with increased contrast for that brightness. Specifically, this curve is the maximum of the R, G and B color components of each pixel named M (determined by the maximum value evaluation unit 101), and the curve application unit 102 (which is easily LUT Typically, after receiving a parameter encoding a mapping function shape such as a gamma coefficient, it is applied on the receiving side that performs color processing, for example, calculated for each shot of an image) The same principle works even if M is luminance or a non-linear representation with luminance or lightness, eg luma, ie 1 / N 乘 of luminance, where N is an integer, etc. Can do. Then, the multiplication coefficient calculation unit 103 calculates an appropriate multiplication coefficient (a) for each pixel currently being processed. This is, for example, the output of the tone mapping function F applied to M, ie F (M) divided by M, when the image is rendered on a first target display, such as a 100 nit LDR display. If the image is needed (for example for an 800 nit PB intermediate display) (or other values, possibly higher than the reference display PB of the HDR input image Im_in), it is rendered directly on the display or communicated Or other function G that rescales the amount of multiplicative mapping of the input color to a value suitable for the display dynamic range to which the image fits (whether stored in some memory for later use) Applies to (M) / M. This is a technique for expressing very complex brightness conversion as multiplication. While the prior art described to illustrate the background of the present invention typically multiplies linear RGB components, embodiments of the present invention are non-linear, eg, typically RGB color representations, For example, Rec. Emphasize that it works with R'G'B 'components transformed with 709 OETF, or powers of R, G and B, which are typically less than 1, eg, exponent values of 1/2.

これまで説明した部分は、全体的な色処理を構成する。これは、連続したピクセルのセットの色の中の特定の値のみに基づいて処理が行われ得ることを意味する(また、それらの色の輝度のみに焦点を当てることにする)。したがって、たとえば画像の円形のサブ選択内のピクセルのセットからピクセルを取得するだけの場合、上記の定式化された原理に従って色処理を行うことができる。しかしながら、人間の視覚は非常に相対的であり、空間的に相対的でもあり、物体の色及び明度は、画像内の他の物体の比色特性との関連で(また、様々な技術的制限も考慮して)判定されるので、より高度なHDR符号化システムは局所処理を行う選択肢を有する。一部の画像において、ランプ又は顔などの1つ又は複数の物体を分離し、その物体に専用処理を行うことを望む。しかしながら、再度要点を強調すると、ここに提示された技術では、これは、単にある分離された色処理ではなく、マスターグレーディングのピクセルの画像から導出可能な少なくとも1つのさらなるグレーディングの符号化の一部(ここではHDRから導出されたLDR)を形成する。市場のより単純な変形形態は局所処理を使用せず(概念的には類似しているが、とりわけ、より複雑な集積回路につながる)、以下の原理はその詳細なしで説明することができるので、その態様をさらに詳述しない。   The part described so far constitutes the overall color processing. This means that processing can be performed based only on specific values in the colors of a continuous set of pixels (and we will focus only on the brightness of those colors). Thus, for example, if only pixels are obtained from a set of pixels in a circular sub-selection of the image, color processing can be performed according to the above formulated principle. However, human vision is very relative and spatially relative, and the color and brightness of an object is related to the colorimetric properties of other objects in the image (and also various technical limitations). More advanced HDR encoding systems have the option of performing local processing. In some images, it may be desirable to separate one or more objects, such as lamps or faces, and perform dedicated processing on the objects. However, to reiterate, in the technique presented here, this is not just some separate color processing, but a part of at least one further grading encoding that can be derived from the image of the master grading pixel. (Here, LDR derived from HDR). The simpler variants of the market do not use local processing (similar in concept but lead to, inter alia, more complex integrated circuits) and the following principles can be explained without their details The embodiment will not be described in further detail.

マスターグレーディング又は導出されたグレーディングが、空間構造、すなわち撮像されたシーンの物体を符号化した画像として受信側に実際に通信され、2つのルック間の関係を符号化する色変換関数もメタデータで伝達される場合、受信側で他のグレーディングを再計算することができる。すなわち、たとえば、HDR画像が受信された場合には、必要に応じて復号によりLDR画像を構築するために、又は逆に、ルックのペアのうちLDR画像が通信された若しくは記憶されている場合には、HDR画像を再構成するために、色処理が必要とされる。局所処理の原理が符号化技術で使用されるという事実は、とりわけ、基本的な数学的処理方法の単純なセットを必要とするという技術的意味合いを有し、その理由は、分野に出ている全ての復号IC又はソフトウェアがこれを実装し、手頃な価格で符号化を理解して復号器LDR画像を生成できる必要があるためである。   The master grading or derived grading is actually communicated to the receiver as a spatial structure, i.e., an image of an imaged scene object, and the color conversion function that encodes the relationship between the two looks is also metadata. If communicated, other gradings can be recalculated at the receiver. That is, for example, when an HDR image is received, in order to construct an LDR image by decoding as necessary, or conversely, when an LDR image is communicated or stored in a look pair Requires color processing to reconstruct the HDR image. The fact that the principle of local processing is used in the coding technique has technical implications, among other things, that it requires a simple set of basic mathematical processing methods, the reasons for which are in the field This is because all decoding ICs or software must be able to implement this and understand the encoding at an affordable price to generate a decoder LDR image.

市場を利用する様々な画像又はビデオのための実際的に有用な符号化技術を設計する場合、技術的な制約は、ICの観点から(安価な装置も単純なIC若しくはICの領域部分又はソフトウェアを必要とするので)、符号化関数ツールを少数にし、スマートに選択して、シーンの様々なダイナミックレンジルック画像を作成し符号化するために最も必要なことを行うようにするべきであるということである(その結果、任意のコンテンツ作成変形形態における任意の「グレーダ」又はコンテンツクリエータは、(所望に十分に近い)HDR/LDR画像ルックペアを作成した所望の結果と、これを記憶又は通信するための対応する符号化とを得る)。他方、それに関する他の問題は、上記で説明された哲学では、人間のカラーグレーダなどが、再グレーディングをLDR画像などで符号化されたものとして指定し、任意の受信側の受信機において適切なHDR画像に再グレーディングする役割を果たすが、所与のシーンの特定のルックのための最適なパラメータのセットにおいて、グレーダはまた、適切なグレーディング/符号化ツールを適切な順序で有することで、それらによって便利に作業できるようにする必要がある(所望のカラールックの良好な精度を得る必要があるだけでなく、時間も重要であるので、望むルックを迅速かつ効率的に得るために、極力少ない操作でこれを行う必要がある)。この2つの対立する制約のセットは、エレガントに提供される必要がある。さらに、LDR画像が任意の受信機に送信される場合、見なければならない第3の基準であって、以下のような技術的解決策が少なくともおおよそ満足しなければならないものさえ存在し、すなわち、あるLDRルック画像を設計した場合、受信機HDR復号器によるHDR画像の再構成は依然として十分な精度でなければならず、したがってこれは、発明時に、汎用的なHDR符号化器及び復号器のための、結果として得られる最適な技術装置ユニットにも影響する。   When designing practically useful coding techniques for various images or videos that take advantage of the market, the technical constraints are from the IC point of view (cheap devices are also simple ICs or area parts of ICs or software The coding function tools should be few and smartly selected to do the most necessary to create and encode the various dynamic range look images of the scene (As a result, any “grader” or content creator in any content creation variant will store or communicate this with the desired result that created the HDR / LDR image look pair (close enough to the desired). And a corresponding encoding for). On the other hand, the other problem is that in the philosophy described above, a human color grader, etc. specifies the regrading as encoded in an LDR image etc. and is appropriate for any receiver at the receiving end. While playing the role of regrading to HDR images, in the optimal set of parameters for a particular look of a given scene, the grader also has the appropriate grading / coding tools in the proper order so that they (Not only need to get good accuracy of the desired color look, but also time is important, so as little as possible to get the look you want quickly and efficiently Need to do this in operation). The two conflicting sets of constraints need to be provided elegantly. Furthermore, there is even a third criterion that must be seen when an LDR image is transmitted to any receiver, and at least approximately the following technical solution must be satisfied: When designing an LDR look image, the reconstruction of the HDR image by the receiver HDR decoder must still be of sufficient accuracy, so this is due to the general purpose HDR encoder and decoder at the time of invention. This also affects the resulting optimum technical equipment unit.

Hattoriらの「HLS:SEI message for Knee Function Information」、16.JCT−VC MEETING、2014年9月1日、San Joseには、1つ又は複数のニーポイントに基づく、シーンホワイトレベルのたとえば1200%までの入力ダイナミックレンジ上の入力HDR輝度(すなわち1200nitまでの符号)と、LDRルマとの間の関係を指定する新たなSEIメッセージが記載されている。ニーポイントは、デジタルセンサが、平均的なグレーワールドの仮定に従って照明された場合に、シーンホワイト(これはシーン平均グレーより約5倍明るい)よりもわずかに明るいだけのシーン物体をハードクリップするという問題傾向を有するという問題を解決するトリックであった。そのアイデアは、より暗いシーン輝度に対してよりノイズが少ない、より優れたセンサがあれば、シーンを少し露出アンダーにして、たとえば、最大でシーンホワイトの4倍までの、シーンホワイトよりも明るい様々なシーン輝度(たとえば、最適なシーン照明下での花嫁の白いドレス)の識別を可能にすることができるというものである(雑にクリップして、たとえばシーンホワイトの1.2倍を超える全てを白、すなわち、ルマY’=8ビットで255に符号化するのではない)。もちろん、そのようなより明るいシーン輝度を正確にカメラセンサに捕捉することは解決策の一部にすぎず、その理由は、たとえばSDR100nitPBディスプレイ上に良好な画質でレンダリングするなどの消費のためにSDR画像を計算する場合に、実際の8ビットルマ符号を、アナログセンサで決定される(最大のまだ記録可能なシーン輝度、すなわち1.0に対する)シーン輝度に割り当てるトリックもさらに必要であるためである。SDR出力ルマ軸上の全ての色を4倍さらには12倍の上方範囲に適合するように単に圧縮することは、エレガントな解決策ではなく、その理由は、同様に良好に露光されてよく見えるはずの暗い物体がその際に暗くなりすぎて良好なSDR画質にならないためである。したがって、より暗いルマの古典的な(Rec.709の)ルマの割り当てをニーポイントまで維持する技法を考案し、ニーポイント以上は、より圧縮された、典型的には対数のルマ符号割り当て戦略を使用して、入力輝度のはるかに高い上方範囲(たとえば、シーンホワイトの1倍からシーンホワイトの4倍までの範囲)が、ニーポイントの位置に応じて、ルマ符号の上方範囲、たとえば上位10%にマッピングされるようにした(又は、SDR画像内の相当な量のシーンホワイトより明るい輝度を絞りたい場合は、ニーポイントをルマ範囲の50%、すなわち8ビットで128、又は10ビットで512に選択することができるが、画像のカラールックは、まだ視認可能だが、著しく悪化し始める)。Hattoriは必要な全ての情報を復号器に迅速に伝達する技法及び実用的手法を導入し、復号器はSDR画像を受信した場合に、1つ又は複数のそのようなニーポイントに基づいてHDR画像の再構成を行うための逆関数を適用するためにその情報を必要とする。ニー処理のメカニズムは、SDR画像のルックを正確に制御するための良い手法ではない。特に、最大で何倍までのシーンホワイトを超える輝度がまだ符号化可能であるべきかを指定するK倍係数が高すぎない場合には(すなわち、中程度の高ダイナミックレンジのシーン)、より高い明度のサブレンジをSDRルマのより小さいサブレンジに連続的に屈曲させる単純かつ高速な関数によってより高いダイナミックレンジ(input_d_range)を屈曲させるのは簡単な手法ではある(これが問題にならないと仮定するが、ニー関数の誤った単純な対数部分によって破壊される、美しい明るいグレー値を有する、雲などのような最も明るい領域などに重要な画像コンテンツを有する場合、これは必ずしも正しくはない)。人間のグレーダが画像のルックを正確に最適化したい場合に特に有用な、単純かつ非常に有用な粗いグレーディング関数をこの文書が教示しないことは明らかである(任意の自動装置で盲目的に使用され得るある合理的に動作する輝度対ルマのマッピングの数学的仕様にすぎないHattoriとは対照的であり、その理由は、その唯一の目的が、HDRルック画像をただ単に、すなわち受信側で再構成可能であり、必ずしも芸術的に見栄えの良くはないSDR画像に符号化することであり、出願人が、一部の実施形態では(半)自動的にも動作するが、同一の符号化原理によって、ハリウッド映画の人間のカラーグレーダによる正確なカラーグレーディングのような、芸術的に正確な要望を有する市場にも応えるべきであるシステムを設計することを望んでいたためである)。より具体的には、HDRシーン画像の正確な暗部及び明部の部分領域の制御も教示されないとしても、放物線の中間区間の教示は明らかに存在せず、Hattoriはそのような実現に到達するために必要なHDR研究を行おうとしていない。   Hattori et al., “HLS: SEI message for Knee Function Information”, 16. JCT-VC MEETING, September 1, 2014, San Jose includes input HDR luminance (ie, codes up to 1200 nits) on the input dynamic range up to, for example, 1200% of the scene white level based on one or more knee points. ) And a new SEI message specifying the relationship between LDR luma. Kneepoints say that when a digital sensor is illuminated according to the average gray world assumption, it will hard clip scene objects that are only slightly brighter than the scene white (which is about 5 times brighter than the scene average gray). It was a trick to solve the problem of having a problem tendency. The idea is that if you have a better sensor that is less noisy for darker scene brightness, make the scene a little underexposed, for example, up to four times the scene white, brighter than the scene white. Discriminating scene brightness (for example, bride's white dress under optimal scene lighting) (clip it sloppyly, for example, all over 1.2 times the scene white) White, ie, luma Y ′ = 8 bits, not encoding to 255). Of course, capturing such brighter scene brightness accurately in the camera sensor is only part of the solution because of the SDR for consumption such as rendering with good image quality on an SDR100 nitPB display, for example. This is because when calculating the image, there is also a need for a trick to assign the actual 8-bit luma code to the scene luminance (relative to the maximum still recordable scene luminance, i.e. 1.0) determined by the analog sensor. Simply compressing all the colors on the SDR output luma axis to fit the upper range of 4x or even 12x is not an elegant solution, because the reason seems to be well exposed as well This is because a supposed dark object becomes too dark at that time and does not provide good SDR image quality. Therefore, we devised a technique to keep darker luma's classic (Rec. 709) luma assignments to knee points, and above knee points, a more compressed, typically logarithmic luma code assignment strategy. Use a much higher upper range of input luminance (eg, a range from 1x scene white to 4x scene white) depending on the position of the knee point, the upper range of the luma code, eg, the top 10% (Or if you want to reduce the brightness brighter than a significant amount of scene white in the SDR image, set the knee point to 50% of the luma range, ie 128 for 8 bits, or 512 for 10 bits. (Although it can be selected, the color look of the image is still visible, but begins to deteriorate significantly). Hattori introduces techniques and practical techniques to quickly communicate all the necessary information to the decoder, and when the decoder receives an SDR image, the HDR image is based on one or more such knee points. That information is needed to apply the inverse function to perform the reconstruction. The knee processing mechanism is not a good technique for accurately controlling the look of the SDR image. Higher, especially if the K-fold factor that specifies how many times the maximum scene white brightness should still be able to be encoded is not too high (ie a medium high dynamic range scene) Bending the higher dynamic range (input_d_range) with a simple and fast function that continually bends the lightness subrange to the smaller subrange of the SDR luma is an easy approach (assuming this is not a problem, but This is not always true if you have important image content, such as in the brightest areas such as clouds, with beautiful bright gray values, destroyed by the wrong simple logarithm part of the function). It is clear that this document does not teach a simple and very useful coarse grading function that is particularly useful when a human grader wants to optimize the look of an image accurately (used blindly on any automated device). In contrast to Hattori, which is only a mathematical specification of a certain reasonably working luminance-to-luma mapping, because its sole purpose is simply to reconstruct the HDR look image, ie, at the receiver. It is possible to encode into SDR images that are not necessarily artistic, and the Applicant works (semi-) automatically in some embodiments, but with the same encoding principle Design a system that should also cater to markets with artistic accuracy, such as accurate color grading with human color graders in Hollywood movies This is because the wanted Rukoto). More specifically, there is clearly no teaching of the middle section of the parabola, even though the precise dark and bright partial region control of the HDR scene image is not taught, and Hattori reaches such an implementation. Is not trying to do the necessary HDR research.

米国特許出願公開第2015/010059号もまた、SEI画像教示として伝達されるこの同一のニーポイント曲線(モデル3:いくつかのピボット点)を含み、S曲線の教示も含み、これは本出願の教示とは無関係の、他の可能なHDRからSDRへのマッピング曲線にすぎない。   US Patent Application Publication No. 2015/010059 also includes this same knee point curve (model 3: several pivot points) communicated as SEI image teaching, including the teaching of the S curve, It is just another possible HDR to SDR mapping curve that is independent of the teaching.

Zicong Maiら、「Optimizing a Tone Curve for Backward−Compatible High Dynamic Range Image and Video Compression」、IEEE Transactions on image processing、vol.20、no.6、2011年6月も、再構成可能なHDR画像を実際にSDR画像として伝達する手法であるが、大きく異なる手法で、すなわち、入力画像の輝度ヒストグラムに基づいて決定される画像最適マッピング関数形状を計算することによって行うものである(大きい領域には少なすぎる符号を割り当てず、これはバンディングを導入する場合があり、図3を参照されたい)。   Zicon Mai et al., "Optimizing a Tone Curve for Backward-Compatible High Dynamic Range Image and Video Compression, IEEE Transactions on cessations." 20, no. 6, June 2011 is also a method of actually transmitting a reconfigurable HDR image as an SDR image, but an image optimum mapping function shape determined by a greatly different method, that is, based on a luminance histogram of an input image (Do not allocate too few codes for large regions, this may introduce banding, see FIG. 3).

国際公開第2014/178286号もやはりニー型の符号化器(図3)であり、シーンホワイトよりも幾分明るいシーン輝度(N倍)をSDR符号に含めることを可能にする。次いでこれを使用して、たとえばNが8又は10である場合にSDRディスプレイよりもN倍明るいピーク明度を有するHDRディスプレイ上にHDR画像(最も明るい物体をきれいに明るくするもの)をレンダリングすることができる(図7)。   WO 2014/178286 is also a knee-type encoder (FIG. 3) that allows scene brightness (N times) somewhat brighter than scene white to be included in the SDR code. This can then be used to render an HDR image (one that brightens the brightest object cleanly) on an HDR display with a peak brightness N times brighter than the SDR display when N is 8 or 10, for example. (FIG. 7).

国際公開第2014/128586号もまた、HDRシーンのHDR画像を実際に、視聴者の宅内に既に多数配備されているレガシーSDRディスプレイ上に直接レンダリングするために使用可能なSDR画像として通信する様々な技術教示を含む。これは、画像別の高度にカスタマイズされた輝度マッピング曲線形状が有用な場合があることを教示するが(図8)、目下の粗い関数が、対応するグレーディングされたSDR技術と共に通信される実際のHDRにおける非常に有用な関数であるというようなことは何も教示しない。   WO 2014/128586 also introduces a variety of communicating HDR images of HDR scenes as SDR images that can actually be used to render directly on legacy SDR displays already deployed in large numbers in the viewer's premises. Includes technical teaching. This teaches that highly customized brightness mapping curve shapes by image may be useful (FIG. 8), but the actual coarse function is communicated with the corresponding graded SDR technique. It does not teach anything that it is a very useful function in HDR.

従来技術はいずれも、本出願のエレガントかつ単純なHDR符号化システムの方向にすら示唆を与えておらず、本出願は批判的なカラーグレーダでさえ、全ての実用的な目的のために、高品質のSDR画像に効率的に到達することを可能にする。   None of the prior art gives any suggestions in the direction of the elegant and simple HDR coding system of the present application, and the present application is highly efficient for all practical purposes, even for critical color graders. It enables to reach quality SDR images efficiently.

ICがビデオ速度で動作させるのに十分に計算的に単純であるだけでなく、グレーダが任意の意図したディスプレイ上(少なくともHDRディスプレイ、及び他のもの、典型的にはレガシーLDRディスプレイ上であるが、HDR画像から開始する関数型再グレーディング色変換を指定するパラメータによって、少なくともHDRルックが符号化されるHDRディスプレイと、LDRルックが共に符号化されるLDRディスプレイとの間の様々なディスプレイ上で、符号化は良好に見えることが好ましく、両方の画像は典型的には[0,1]にスケーリングされた10ビットワードとして定義される)に表示するための任意の詳細なカラールックを指定するのに十分に汎用的で扱いやすくもある実用上有用な符号化システムを有するという上記の課題は、入力画像(Im_in)のピクセルの入力色(Y’UV_LDR)を出力画像(Im_res、REC_HDR)のピクセルの赤、緑及び青の色成分の出力色(R’o,G’o,B’o)に変換するように構成され、その入力画像が第1の輝度ダイナミックレンジ(DR_1)を有し、その出力画像が第2の輝度ダイナミックレンジ(DR_2)を有し、第1のダイナミックレンジのピーク輝度が第2のダイナミックレンジのピーク輝度より少なくとも2倍低いか又はその逆であり、傾き変数(InvBet)によって決定される最も暗い入力ルマ値を含む入力画像色のルマの範囲の暗いサブレンジ(SR_d)のための線形区間と、第2の傾き変数(InvAlph)によって制御される明るいサブレンジ(SR_br)における最も明るい入力ルマ値のための第2の線形区間と、2つの線形区間の間の放物線区間とを含む3区間明度再グレーディング曲線を適用するように構成される粗マッピングユニット(202、552)を備える画像色処理装置(200)を備える、HDRビデオ復号器(250)によって解決される。   In addition to being computationally simple enough for ICs to operate at video speeds, the grader is on any intended display (although at least on HDR displays and others, typically legacy LDR displays). , On various displays between the HDR display where at least the HDR look is encoded and the LDR display where the LDR look is encoded together, with parameters specifying a functional regrading color transformation starting from the HDR image, The encoding preferably looks good, and both images specify an arbitrary detailed color look for display (typically defined as a 10-bit word scaled to [0,1]) In addition to having a practically useful coding system that is sufficiently versatile and easy to handle The problem is that the input color (Y′UV_LDR) of the pixel of the input image (Im_in) is changed to the output color (R′o, G′o, of the red, green and blue color components of the pixel of the output image (Im_res, REC_HDR)). B′o), the input image has a first luminance dynamic range (DR — 1), the output image has a second luminance dynamic range (DR — 2), and the first dynamic The peak luminance of the range is at least twice lower than the peak luminance of the second dynamic range or vice versa, and the darkness of the luma range of the input image color including the darkest input luma value determined by the slope variable (InvBet) The linear interval for the subrange (SR_d) and the bright subrange (SR_br) controlled by the second slope variable (InvAlph) A coarse mapping unit (202, 552) configured to apply a three-interval lightness grading curve including a second linear interval for the brightest input luma value and a parabolic interval between the two linear intervals This is solved by an HDR video decoder (250) comprising an image color processing device (200) comprising:

作成側、たとえばパラメータを調整する人物は、HDRシーン又はその画像の特性と、第2に所望の場合に、画像が符号化される符号化の特性とに応じて必要な傾きを決定することができる。典型的には、符号化の出力画像(受信機及びそれを構成する復号器が受信する入力画像である)が100nitPBのRec.709のSDR符号化である場合、たとえば、グレーダ(又は測定された画像特性に基づく自動曲線決定アルゴリズム)は、たとえば、入力マスターHDR画像のPBに対する曲線形状を決定する(たとえば、5000nit対1000nitPB)。しかしながら、コンテンツに基づいて正確な形状を決定してもよい。たとえば、図4の単車のような非常に暗いコンテンツが存在する場合、グレーダはそれを、HDRディスプレイ(たとえば、2000nitPB)上のHDR画像レンダリングでは比較的深い輝度とするが、HDRシーンのLDR画像符号化では比較的高く明るくされたものとすることを望む(典型的なSDRディスプレイ上にレンダリングされた場合に視認可能である必要がある)。また、クリエータは、HEVCコーデックなどがLDR画像の符号化に使用するビット数のような、典型的なLDR画像符号化の詳細を既に考慮に入れている。復号器のいくつかの実施形態は、線形区間間の放物線領域を自律的に決定し、たとえば、入力ルマ範囲の常に固定の20%、又は2つの区間の傾きに応じたパーセンテージ(たとえば、傾きの差が大きい場合はより多い)、さらには、画像の現在のショットの特徴、たとえば、暗い範囲より上の中間の明度範囲に多くの細部が存在するか否か、若しくは滑らかな勾配が存在するか否かなどに基づく。   The creator, for example, the person adjusting the parameters, may determine the required slope according to the characteristics of the HDR scene or its image and, secondly, the characteristics of the encoding in which the image is encoded if desired. it can. Typically, an output image of encoding (an input image received by a receiver and a decoder constituting the same) is a 100 nit PB Rec. In the case of 709 SDR encoding, for example, a grader (or an automatic curve determination algorithm based on measured image characteristics), for example, determines the curve shape for the PB of the input master HDR image (eg, 5000 nit vs. 1000 nit PB). However, an accurate shape may be determined based on the content. For example, if there is very dark content such as a single car in FIG. 4, the grader makes it a relatively deep luminance for HDR image rendering on an HDR display (eg, 2000 nit PB), but the LDR image code of the HDR scene. We want it to be relatively high and bright (they need to be visible when rendered on a typical SDR display). In addition, the creator has already taken into account typical LDR image encoding details, such as the number of bits that the HEVC codec and the like uses to encode the LDR image. Some embodiments of the decoder autonomously determine the parabolic region between linear intervals, eg, a constant 20% of the input luma range, or a percentage depending on the slope of the two intervals (eg, the slope More if the difference is large), or whether there are more details in the current shot characteristics of the image, for example whether there is more detail in the intermediate brightness range above the darker range, or whether there is a smooth gradient Based on whether or not.

しかしながら、他の実施形態では、グレーダ、又は一般的にはクリエータは、放物線領域の幅を指定することができ、たとえば、2つの幅(どの点から放物線部分が線形部分に変化するか)W1及びW2を、復号器が規定可能なある定義された点、たとえば、線形部分が連続した場合に交差する場所から指定する。又は、これを単一の幅の値として伝達することができる。唯一の必要な条件は、復号器が逆3区間明度再グレーディング関数を適用して、受信されたLDR画像からHDRシーンの再構成されたHDRルック画像を得ることができることである。様々な実施形態では、図2に示された凹型上方屈曲関数のパラメータ(すなわち、InvBet、InvAlph)を送信することができ、又は同様に、ダウングレード曲線パラメータ(alph、bet)を送信することができる。一方の曲線を他方の曲線に容易に変換することができ、たとえば、LUTを所望の精度に設定し、次いで軸を交換することができ、したがって、当業者は、説明の簡単のために、実際の実現における両方の可能性について話していることを理解するであろう。一般に、所望に応じて2つのさらなるパラメータが存在し、たとえば、ホワイトオフセットWh_oであり、これは出力LDRルマ符号範囲上で最も明るいHDR符号が収まる場所を規定する(又は典型的には他の実施形態では、HDRの最も明るい入力輝度又はルマから垂直軸上に定義されてもよく、その場合、この値を超えるHDR色はLDR表現においてクリップされ、これは画像符号化の特定の用途次第で有用であるか又は望ましくないことがある)。同様に、ダークオフセットB_oが存在し、これはグレーダが他の原理に基づいて決定するものであり、その理由は、ディスプレイ上の暗色のレンダリングが明色のレンダリングと異なるためである。したがって、一般的なシステムにおいて、5つのパラメータalph、bet、W(=W1+W2であって、予め合意された手法で定義され、たとえば交点303の左右に50%である)、B_o及びWh_oを供給する符号化器の実施形態を有することは有用である。   However, in other embodiments, the grader, or generally the creator, can specify the width of the parabolic region, eg, two widths (from which point the parabolic portion changes to a linear portion) W1 and W2 is specified from some defined point that can be defined by the decoder, for example, from where it intersects when the linear portion is continuous. Or it can be conveyed as a single width value. The only necessary condition is that the decoder can apply an inverse 3-section lightness grading function to obtain a reconstructed HDR look image of the HDR scene from the received LDR image. In various embodiments, the parameters of the concave upbending function shown in FIG. 2 (ie, InvBet, InvAlph) can be transmitted, or similarly, the downgrade curve parameters (alph, bet) can be transmitted. it can. One curve can be easily converted to the other, for example, the LUT can be set to the desired accuracy and then the axes can be exchanged, so that those skilled in the art can You will understand that you are talking about both possibilities in the realization of. In general, there are two additional parameters as desired, eg, white offset Wh_o, which defines where the brightest HDR code will fit on the output LDR luma code range (or typically other implementations). The form may be defined on the vertical axis from the brightest input luminance or luma of HDR, in which case HDR colors exceeding this value will be clipped in the LDR representation, which may be useful depending on the particular application of image coding Or may be undesirable). Similarly, there is a dark offset B_o, which is determined by the grader based on other principles, because the dark color rendering on the display is different from the light color rendering. Therefore, in a general system, five parameters alpha, bet, W (= W1 + W2, defined in a pre-agreed manner, for example 50% to the left and right of the intersection 303), B_o and Wh_o are supplied. It is useful to have an encoder embodiment.

単純な実施形態は3区間曲線で十分である。より高度な実施形態はさらなる色変換を適用する。たとえば、第1の事前色変換ユニット224は、3部分曲線の適用前に、たとえば人間の視聴者にとってより均一に画像の色を分散させる変換を適用する。事後色変換ユニット203は他の色変換関数を適用し、たとえば、グレーダは、3部分曲線から得られる明度ルックと比較して、ルマ範囲のある特定の部分を暗くすることができる。ドメイン色変換ユニット204は、たとえば、平方根又はRec.709ドメインのY’o結果を得る代わりに、さらなる色空間変換を行い、同様に、たとえば知覚的に線形化されたドメインで計算を行うことなどもできる。もちろん、入力及び出力カラードメインは、典型的には、3部分曲線の正確な形状と、それを特徴付ける上述の2つ、3つ又は5つのパラメータとに影響を及ぼし得る。最後に、必要な色変換を行って、たとえばRec.709の結果、すなわち、あるHDRルマ定義、たとえばPQさらには線形R’o、G’o、B’o色成分仕様を有するものを生成した後、カラーフォーマットユニット226はさらに、接続されたディスプレイを直接駆動するのに適した最終的なRGB色空間の色、たとえばRd、Gd、Bdを指定し、接続されたディスプレイは典型的には、標準的又はディスプレイ固有である、ある事前指定された光−電気伝達関数(OETF:Opto−electronic transfer function)などに典型的には従うあるHDR画像定義をその画像接続(ケーブル又は無線)において予期するHDRディスプレイである。カスタマイズ関数適用ユニット(203)は、この現在のHDRシーンのニーズ(具体的には、非常に小さいLDR輝度範囲で全ての物体明度のパズルをつなぎ合わせることの複雑さ)に基づいて非常に詳細な正確な関数を設計することを、(たとえば、十分な時間、計算資源などを使用して)それが実行できる場所において、すなわち典型的には作成側で行うことを可能にする(また、この関数の形状の情報は受信側装置に伝達される)。特に、人間のカラーグレーダは、非線形形状を微調整して、開始画像の主要な物体又は領域の輝度に対応する全ての適切な場所でそれを屈曲させることができる。したがって、たとえば小部分を生成画像において任意の輝度まで望むように明るくすることができる。特に、たとえば屋内シーンのほとんどが既に正しい輝度を有しているが、窓を通して見える空のある小部分が明るすぎる又は暗すぎる場合、カスタム曲線CCは、それらのピクセル色のみを色変換するように設計することができる。いくつかの特定の実施形態では、カスタム曲線は、その勾配が入力範囲のどこでも最小値を下回らないように設計することさえできる。将来の市場における様々な種類のHDR画像又はビデオ処理システム(たとえば、放送、LDRベースの既存の衛星チャンネル、対して、インターネット配信)と、様々な種類のコンテンツ(ハリウッドの非常に壮大なHDRの芸術的な画像、対して、発生したダイナミックレンジが発生する現場制作)とに適合できるように本システムを設計しており、したがって、カスタム曲線ユニットは、いかなる詳細な輝度(明度)の挙動でも、それを必要とする画像のどの部分に対しても、また、様々な実装形態において、これが実現される作成側の実装労力がどれほど多くても又は少なくても、実装することを可能にする。   In a simple embodiment, a three-section curve is sufficient. More advanced embodiments apply additional color transformations. For example, the first pre-color conversion unit 224 applies a transformation that distributes the color of the image more uniformly, for example, for a human viewer, before applying the tri-part curve. The a posteriori color conversion unit 203 applies other color conversion functions, for example, the grader can darken certain parts of the luma range as compared to the lightness look obtained from a three-part curve. The domain color conversion unit 204 is, for example, a square root or a Rec. Instead of obtaining Y'o results for the 709 domain, further color space transformations can be performed, and similarly, for example, calculations can be performed on a perceptually linearized domain. Of course, the input and output color domains can typically affect the exact shape of the three-part curve and the two, three, or five parameters described above that characterize it. Finally, necessary color conversion is performed, for example, Rec. After generating the results of 709, ie, some HDR luma definitions, such as those with PQ or linear R'o, G'o, B'o color component specifications, the color format unit 226 further displays the connected display. Specify a final RGB color space color suitable for direct drive, eg Rd, Gd, Bd, and the connected display is typically a pre-specified light that is standard or display specific An HDR display that expects an HDR image definition in its image connection (cable or wireless) that typically follows an electro-transfer function (OETF) or the like. The customization function application unit (203) is very detailed based on this current HDR scene need (specifically, the complexity of splicing all object brightness puzzles in a very small LDR luminance range). Designing an exact function can be done where it can be performed (eg, using sufficient time, computational resources, etc.), i.e. typically on the author side (and this function Is transmitted to the receiving side device). In particular, the human color grader can fine tune the non-linear shape and bend it at all suitable locations corresponding to the brightness of the main object or region of the starting image. Thus, for example, a small portion can be brightened as desired to an arbitrary brightness in the generated image. In particular, for example if most of the indoor scene already has the correct brightness, but some small part of the sky visible through the window is too bright or too dark, the custom curve CC will only convert those pixel colors. Can be designed. In some specific embodiments, the custom curve can even be designed such that its slope does not fall below a minimum value anywhere in the input range. Various types of HDR image or video processing systems in the future market (eg broadcast, LDR-based existing satellite channels versus Internet distribution) and various types of content (very magnificent HDR art in Hollywood) The system has been designed to be compatible with typical images (as opposed to on-site production where the generated dynamic range occurs), so the custom curve unit can be used for any detailed luminance (brightness) behavior. It can be implemented for any part of the image that needs to be implemented, and in various implementations, no matter how much or less the implementation effort of the creator on which this is realized.

以下の非網羅的な実施形態は非常に有用である。   The following non-exhaustive embodiments are very useful.

画像色処理装置(200)が、3区間曲線を低ダイナミックレンジルマ(Y’_LDR)に適用するように構成される、請求項1に記載のHDRビデオ復号器(250)。これはある特定のドメイン、たとえば2つのグレーディングの1つのルマドメイン、たとえば典型的にはSDRルマにおいて動作するために有用である。   The HDR video decoder (250) of claim 1, wherein the image color processing device (200) is configured to apply a three-section curve to a low dynamic range luma (Y'_LDR). This is useful for operating in one particular domain, eg one luma domain of two gradings, eg typically SDR luma.

画像色処理装置(200)が、好ましくはNが2である指数1/Nのべき関数によって3区間曲線を入力色に適用した出力結果である色の輝度に関連する出力ルマ(Y’o)を、3区間曲線を適用した結果として生成するように構成される、HDRビデオ復号器(250)。   The output luma (Y'o) related to the luminance of the color, which is the output result of the image color processing device (200), preferably applying a three-section curve to the input color by a power function of index 1 / N where N is 2 HDR video decoder (250), configured to generate as a result of applying a three-section curve.

画像色処理装置(200)が、出力ルマ(Y’o)を乗算係数とする乗算を、現在処理中のピクセルの色の好ましい非線形の色表現(R’s、G’s、B’s)に適用する乗算器(225)を備えることによって、出力色を決定するように構成される、HDRビデオ復号器(250)。   The image color processing apparatus (200) performs a multiplication using the output luma (Y'o) as a multiplication coefficient, and a preferable non-linear color expression (R's, G's, B's) of the color of the pixel currently being processed. An HDR video decoder (250) configured to determine an output color by comprising a multiplier (225) applied to the.

画像色処理装置(200)が、平方根関数に近い形状であって、Nを整数値とする指数1/Nのべき関数であることが好ましい非線形関数によって線形R、G、B色成分から技術的に定義される非線形の色表現(R’s、G’s、B’s)を得るように構成される、HDRビデオ復号器(250)。   The image color processing device (200) is technically derived from linear R, G, and B color components by a non-linear function, preferably having a shape close to a square root function and an exponential 1 / N function where N is an integer value. An HDR video decoder (250) configured to obtain a non-linear color representation (R's, G's, B's) as defined in

受信されたメタデータから第1及び第2の傾き変数を読み取るように構成され、それを粗マッピングユニット(202、552)に供給するように構成される読み取りユニット(277)を備える、HDRビデオ復号器(250)。   HDR video decoding comprising a reading unit (277) configured to read the first and second slope variables from the received metadata and configured to supply it to the coarse mapping units (202, 552) Vessel (250).

読み取りユニット(277)がさらに、受信されたメタデータから2つの線形区間の間の放物線領域の幅(W_par)を読み取るように構成され、それを粗マッピングユニット(202、552)に供給するように構成される、HDRビデオ復号器(250)。   The reading unit (277) is further configured to read the width of the parabolic region (W_par) between the two linear intervals from the received metadata and supply it to the coarse mapping unit (202, 552). An HDR video decoder (250) configured.

連続した画像の復号器HDRビデオを生成するビデオ復号の方法であって、傾き変数(InvBet)によって決定される最も暗い入力ルマ値を含む入力画像色のルマの範囲の暗いサブレンジ(SR_d)のための線形区間と、第2の傾き変数(InvAlph)によって制御される明るいサブレンジ(SR_br)における最も明るい入力ルマ値のための第2の線形区間と、2つの線形区間の間の放物線区間とを含む3区間明度再グレーディング曲線を適用して、色変換中の入力色の好ましい非線形のRGB色表現(R’s、G’s、B’s)との乗算に供給される出力ルマ(Y’o)を生成するステップを有する、方法。   A method of video decoding to generate a continuous image decoder HDR video for the dark subrange (SR_d) of the luma range of the input image color including the darkest input luma value determined by the slope variable (InvBet) Linear interval, a second linear interval for the brightest input luma value in the bright subrange (SR_br) controlled by the second slope variable (InvAlph), and a parabolic interval between the two linear intervals The output luma (Y'o) supplied to the multiplication of the preferred non-linear RGB color representation (R's, G's, B's) of the input color during color conversion by applying a three-interval lightness grading curve ).

入力画像(Im_in)のピクセルの入力色を出力画像(IMED)のピクセルの出力色(Y’UV)に変換するように構成され、その入力画像が第2の輝度ダイナミックレンジ(DR_2)を有し、その出力画像が第1の輝度ダイナミックレンジ(DR_1)を有し、第1のダイナミックレンジのピーク輝度が第2のダイナミックレンジのピーク輝度より少なくとも2倍低いか又はその逆であり、傾き変数(InvBet)によって決定される最も暗い入力ルマ値を含む入力画像色のルマの範囲の暗いサブレンジ(SR_d)のための線形区間と、第2の傾き変数(InvAlph)によって制御される明るいサブレンジ(SR_br)における最も明るい入力ルマ値のための第2の線形区間と、2つの線形区間の間の放物線区間とを含む3区間明度再グレーディング曲線を適用するように構成される粗マッピングユニット(503)を備える画像色処理装置(200)を備える、HDRビデオ符号化器(501)。   Configured to convert an input color of a pixel of an input image (Im_in) to an output color (Y′UV) of a pixel of an output image (IMED), and the input image has a second luminance dynamic range (DR_2) The output image has a first luminance dynamic range (DR_1), the peak luminance of the first dynamic range is at least twice lower than the peak luminance of the second dynamic range, or vice versa, and the slope variable ( A linear interval for the dark subrange (SR_d) of the luma range of the input image color including the darkest input luma value determined by InvBet), and a bright subrange (SR_br) controlled by the second slope variable (InvAlph) Includes a second linear interval for the brightest input luma value at and a parabolic interval between the two linear intervals Image color processing apparatus comprising a coarse mapping unit configured to apply a section brightness re grading curve (503) comprises a (200), HDR video encoder (501).

画像色処理装置(200)が、3区間曲線を非線形ドメインの入力色の色表現に適用するように構成され、その色成分が、線形の赤、緑及び青の加法色成分に基づく非線形関数によって定義されることを特徴とする、HDRビデオ符号化器(501)。   An image color processing device (200) is configured to apply a three-section curve to a color representation of an input color in a non-linear domain, the color components of which are determined by a non-linear function based on linear red, green and blue additive color components An HDR video encoder (501), characterized in that it is defined.

画像色処理装置(200)が、3区間曲線を入力色の線形の赤、緑及び青の色表現に適用するように構成される、HDRビデオ符号化器(501)。   An HDR video encoder (501), wherein the image color processor (200) is configured to apply a three-section curve to linear red, green and blue color representations of the input color.

画像色処理装置(200)が、非線形関数によって出力色の輝度に関連する非線形ルマ(Y’o)を含む表現で出力色を決定するように構成される、HDRビデオ符号化器(501)。   An HDR video encoder (501), wherein the image color processor (200) is configured to determine an output color with a representation that includes a non-linear luma (Y'o) related to the luminance of the output color by a non-linear function.

画像色処理装置(200)が、標準ダイナミックレンジビデオ符号化によって定義される表現で出力色を決定するように構成され、出力ルマ(Y’o)色成分が、Rec.709光−電気伝達関数又は平方根によって定義されることを特徴とする、HDRビデオ符号化器(501)。   The image color processing device (200) is configured to determine an output color with a representation defined by standard dynamic range video coding, and the output luma (Y'o) color component is set to Rec. 709 HDR video encoder (501), characterized by being defined by an optical-electrical transfer function or square root.

低ダイナミックレンジ画像に符号化されるHDR画像セットを生成する、HDRビデオ符号化の方法であって、入力画像(Im_in)のピクセルの入力色を出力画像(IMED)のピクセルの出力色(Y’UV)に変換するステップであって、その入力画像が第2の輝度ダイナミックレンジ(DR_2)を有し、その出力画像が第1の輝度ダイナミックレンジ(DR_1)を有し、第1のダイナミックレンジのピーク輝度が第2のダイナミックレンジのピーク輝度より少なくとも2倍低いか又はその逆であり、傾き変数(InvBet)によって決定される最も暗い入力ルマ値を含む入力画像色のルマの範囲の暗いサブレンジ(SR_d)のための線形区間と、第2の傾き変数(InvAlph)によって制御される明るいサブレンジ(SR_br)における最も明るい入力ルマ値のための第2の線形区間と、2つの線形区間の間の放物線区間とを含む3区間明度再グレーディング曲線を適用するステップを有する、変換するステップを有する、方法。   An HDR video encoding method for generating an HDR image set that is encoded into a low dynamic range image, wherein an input color of a pixel of an input image (Im_in) is converted to an output color (Y ′) of a pixel of an output image (IMED) UV), the input image has a second luminance dynamic range (DR_2), the output image has a first luminance dynamic range (DR_1), The dark subrange of the luma range of the input image color, where the peak luminance is at least twice lower than the peak luminance of the second dynamic range or vice versa, including the darkest input luma value determined by the slope variable (InvBet) SR_d) and a bright sub-range (S) controlled by a second slope variable (InvAlph) Applying a three-interval lightness grading curve comprising a second linear interval for the brightest input luma value in _br) and a parabolic interval between the two linear intervals, comprising the step of converting .

プロセッサによって実行された場合に、上記の方法の請求項のいずれか一項に定義された全てのステップを適用するコードと、あるピクセル化された色成分データ、及び3区間曲線を指定するメタデータ、すなわち、典型的には上記の少なくとも2つの、又は好ましくは5つのパラメータ(alph、bet、W、Wh_o、B_o)を受信することによって、(LDRとして)受信されたHDR画像を復号し再構成するように受信機を技術的に機能させる情報を、メモリ上であるか他の技術的手段上であるかに関わらず含む信号とを含む、コンピュータ可読メモリ。   Code that, when executed by a processor, applies all the steps defined in any one of the above method claims, some pixelated color component data, and metadata specifying a three-section curve Ie, decoding and reconstructing the received HDR image (as LDR), typically by receiving at least two or preferably five parameters (alpha, bet, W, Wh_o, B_o) as described above A computer readable memory comprising: a signal comprising information that causes the receiver to function technically, whether on memory or other technical means.

本発明による方法及び装置の任意の変形形態のこれら及び他の態様は、以下に説明される実装形態及び実施形態を参照して、また、添付の図面を参照して明らかになり解明され、図面はより一般的な概念を例示する非限定的な特定の例示としての役割を果たすにすぎず、構成要素が任意選択であることを示すために破線が使用され、非破線の構成要素は必ずしも必須ではない。また、破線は、必須であると説明されている要素が物体の内部に隠れていることを示すために、又は物体/領域の選択、チャートでの値レベルの指示などの無形のもののために使用することもできる。   These and other aspects of any variation of the method and apparatus according to the present invention will become apparent and elucidated with reference to the implementations and embodiments described hereinafter and with reference to the accompanying drawings, in which: Serves only as a non-limiting specific example to illustrate a more general concept, dashed lines are used to indicate that components are optional, and non-dashed components are not necessarily required is not. Also, the dashed line is used to indicate that an element described as essential is hidden inside the object, or for intangibles such as object / region selection, value level indication on a chart, etc. You can also

局所色処理を含むダイナミックレンジ変換を行うための、出願人によって以前に発明され特許取得された可能な色処理装置を概略的に示す図であり、この色処理は典型的には入力画像内の物体の輝度を変化させることを少なくとも含み、これは一部の概念を解明するが、本発明の好ましい実施形態は、非線形RGB色空間及び典型的にはその対応するルマY’において、必要な変更を加えて適用される。FIG. 1 schematically illustrates a possible color processing device previously invented and patented by the applicant for performing dynamic range conversion including local color processing, which color processing typically occurs in an input image; At least including changing the brightness of the object, which elucidates some concepts, the preferred embodiment of the present invention requires the necessary changes in the nonlinear RGB color space and typically its corresponding luma Y ′. Applied in addition. 受信されたLDR画像からHDR画像をパラメトリックに復号し生成することが可能なシステムのためのダイナミックレンジ変換を行うように構成されるシステムの一例を概略的に示す図であり、すなわち、HDRシーンのHDRルックも、受信されたLDRルック画像からHDRルック画像を導出するための色変換関数を特徴付けるメタデータを介して受信されるが、LDR画像ピクセル色のみが実際に受信側に送信され受信される。FIG. 1 schematically illustrates an example of a system configured to perform dynamic range conversion for a system capable of parametrically decoding and generating HDR images from received LDR images, ie, an HDR scene The HDR look is also received via metadata characterizing a color conversion function for deriving the HDR look image from the received LDR look image, but only the LDR image pixel color is actually sent to the receiver and received. . HDR画像ピクセル色データからLDRを符号化するための1つの典型的な3区間の粗い最初のルママッピングの符号化側関数形状を示す図であり、入力は、たとえばHDR線形輝度ドメインにあり、出力(垂直軸)は、たとえば典型的にはLDR平方根LDRルマドメインにある。FIG. 4 is a diagram illustrating the encoding side function shape of one typical three-section coarse first luma mapping for encoding LDR from HDR image pixel color data, where the input is, for example, in the HDR linear luminance domain and the output The (vertical axis) is typically in the LDR square root LDR luma domain, for example. より低いダイナミックレンジのディスプレイにおいて、レガシー100nitピーク明度(PB)SDRディスプレイの設置基盤でさえ視認可能である必要があるHDRコンテンツに関する典型的な技術的及び芸術的問題をいくつかの例によって明らかにする図である。Several examples illustrate typical technical and artistic issues related to HDR content that need to be visible even on a legacy 100 nit peak brightness (PB) SDR display installation base in lower dynamic range displays FIG. 出願人の装置及び方法の実施形態が有利に使用される例示的なビデオ符号化システムを概略的にもう少し明らかにする図である。FIG. 2 schematically illustrates a little more exemplary video encoding system in which Applicants apparatus and method embodiments are advantageously used.

図1は、(少なくとも)2つのグレーディングされた画像(HDR、たとえば5000nitPB、及びPB=100nitの標準SDR LDR)を符号化して、大幅に異なるダイナミックレンジ(PB)のディスプレイ上にレンダリングするためのシステムの1つの可能な色変換と、特にその色変換コアユニットとを示す。当業者であれば、人間のグレーダが計算を実行して、どのようなルックを実際に作成しているかを較正済みディスプレイ上で確認しつつ、同時に符号化関数ツールキットにおけるグレーディング関数の自身の嗜好に応じた最適パラメータ値を指定するコンテンツ作成側と、たとえば、セットトップボックス、BDプレーヤー、コンピュータ、ディスプレイ自体、又は映画館の業務用システムなどのビデオ受信及び色処理デバイスに装置が含まれる受信側との両方にこのシステムが存在できることを理解する。   FIG. 1 illustrates a system for encoding (at least) two graded images (HDR, eg, 5000 nit PB, and standard SDR LDR with PB = 100 nit) and rendering them on a display with a significantly different dynamic range (PB). One possible color conversion and in particular its color conversion core unit. One of ordinary skill in the art can perform a calculation on a calibrated display to see what look the human grader is actually creating, while at the same time his own preference for the grading function in the encoding function toolkit. A content creation side that specifies optimum parameter values according to the receiver, and a receiver that includes the apparatus in a video reception and color processing device such as a set-top box, BD player, computer, display itself, or cinema business system, for example. And understand that this system can exist in both.

2つのグレーディング(HDR及びLDR、これらは次いで、PB=800nitなどの任意の中間ダイナミックレンジMDRディスプレイのためにさらなる計算によってさらに最適化することができる)を指定するデータを既に有する受信側を説明する。   Describe a receiver that already has data specifying two gradings (HDR and LDR, which can then be further optimized by further calculations for any intermediate dynamic range MDR display such as PB = 800 nit) .

したがって、我々の新規な符号化原理によれば、受信装置は、たとえば、ブルーレイディスク上で、若しくはビデオサーバへのインターネット接続を介して、又は他の装置からHDMI(登録商標)ケーブルを介するなどによって受信される、実際に符号化された1つの画像Im_in_HDRしか実際には有さない(たとえば、古典的には10ビットのHEVC符号化だが、正規化された[0,1]画像に当然ながら復号可能である)。次いで、これはLDRグレーディングへと計算される必要があり、たとえばその理由は、LDRディスプレイが接続され、正しくグレーディングされたLDR画像を必要とするためである(たとえば、視聴者はリビングルームのHDRディスプレイの視聴をやめると判断するが、ベッドでポータブルパッドPCで視聴し続ける)。   Thus, according to our new encoding principle, the receiving device can be connected, for example, on a Blu-ray disc or via an Internet connection to a video server or from another device via an HDMI cable. There is actually only one actual encoded image Im_in_HDR received (e.g. classical 10-bit HEVC encoding but naturally decoding into a normalized [0,1] image Is possible). This then needs to be calculated into LDR grading, for example, because the LDR display is connected and requires a correctly graded LDR image (eg, viewers can view the HDR display in the living room) Will continue to watch on the portable pad PC in bed).

色変換を行うことができるためには、色変換装置は、関数を指定するパラメータ(CF)も必要とする。当業者であれば、たとえば放物線は、始点及び終点、直線の開始の傾き及び曲率などによって指定できることを理解する。   In order to be able to perform color conversion, the color conversion device also requires a parameter (CF) that specifies a function. Those skilled in the art will appreciate that, for example, a parabola can be specified by the start and end points, the slope of the start of the line, the curvature, and the like.

典型的には、HDRからLDRへのマッピングの飽和制御だけでなく、少なくとも出力物体の輝度に影響するマッピングも含まれる(ただし、数学的には線形RGB色成分を乗法的にスケーリングすることによって、その輝度マッピングを典型的には適用する)。   Typically, this includes not only saturation control of the HDR to LDR mapping, but also mappings that affect at least the brightness of the output object (but mathematically by scaling the linear RGB color components multiplicatively, That luminance mapping is typically applied).

図2は、その輝度再グレーディングをどのように好ましく行うことができるかをより詳細に示す。   FIG. 2 shows in more detail how the luminance regrading can be preferably performed.

SDR画像、すなわち、符号化されたY’UV(又はY’CbCr)が入力されると仮定する。それらを行列演算して、入力画像ピクセルのスケーリングされたRGB成分R’sG’sB’sにすることができる。これらは、たとえば、平方根ルマドメインにあると仮定する(すなわち、対応する線形色成分は二乗によって出現する)。対応するY’_LDRルマは、Y’UV表現から簡単に分離される。これらのR’sG’sB’sの値が、実際には最終的に得られるHDR色成分(R’o、G’o、B’o)のあるスケーリングされたバージョンであることを図4Bに見ることができ、図4Bでは、LDR及びHDR両方のグレーディングの1つの色を、同一の最大ルマ=1.0に正規化されたRGB色域(たとえば、Rec.2020プライマリなど)において示す。単車が、HDR画像で駆動されたときにHDRディスプレイ上で有するのと同一の絶対輝度(5nit)で、LDR画像で駆動されたときにLDRディスプレイ上にレンダリングされなければならない場合、これはその(相対的な、1に正規化された、すなわち、10ビット符号の場合は1023に正規化された)LDRルマがより高い必要があることを意味する。すなわち、色成分R’o、G’o、B’o及びR’s、G’s、B’sの間の色変換又はその逆も、対応するそれぞれの輝度又はルマY’_HDR及びY’_LDRのスケーリングに対応し、これは乗算器225によって実現されるものである。いくつかの実施形態では、R’s、G’s、B’sは、入力Y’UV色表現から直接計算されるが、他の実施形態では、色変換器223によって適用される、異なるR’s、G’s、B’s値に達するために含まれるさらなる色変換が存在する(図面の全ての破線部分は、市場のより単純な実施形態ではなく、いくつかの他の実施形態については任意選択であることに留意されたい)。これはさらなる明度及び/又は色彩の微調整、たとえば、何らかのルック調整などを適用する。   Assume that an SDR image, ie, encoded Y′UV (or Y′CbCr) is input. They can be matrixed into the scaled RGB components R'sG'sB's of the input image pixels. These are assumed, for example, to be in the square root luma domain (ie, the corresponding linear color component appears by the square). The corresponding Y'_LDR luma is easily separated from the Y'UV representation. It can be seen in FIG. 4B that these R′sG′sB ′s values are actually a scaled version of the finally obtained HDR color components (R′o, G′o, B′o). As can be seen, in FIG. 4B, one color of both LDR and HDR grading is shown in the RGB gamut normalized to the same maximum luma = 1.0 (eg, Rec. 2020 primary). If a motorcycle has to be rendered on an LDR display when driven with an LDR image with the same absolute brightness (5 nits) it has on an HDR display when driven with an HDR image, this is This means that the relative LDR luma, normalized to 1, ie normalized to 1023 for 10-bit codes) needs to be higher. That is, the color conversion between the color components R′o, G′o, B′o and R ′s, G ′s, B ′s or vice versa, and the corresponding luminance or luma Y′_HDR and Y ′. Corresponds to _LDR scaling, which is implemented by multiplier 225. In some embodiments, R ′s, G ′s, B ′s are calculated directly from the input Y′UV color representation, while in other embodiments, the different R applied by the color converter 223. There are additional color transformations included to reach the 's, G's, B's values (all dashed portions of the drawing are not simpler embodiments on the market, but for some other embodiments) Note that is optional.) This applies further lightness and / or color fine-tuning, for example some look adjustment.

次いで、読み取りユニット(277)は、粗マッピングユニット202が、HDR/LDRルック画像ペアを共に符号化するために使用された適切な関数、すなわち、受信されたLDR画像からHDR画像を再構成する手法を適用することを可能にするデータを供給し、たとえば、パラメータを渡すか、又は関数をLUTとして供給する。次いで、(少なくとも)3区間曲線マッピングを適用することによって得られた正確にスケーリングされたルマY’oは、3つのスケーリングされた色成分のそれぞれに乗算する入力乗数として使用されて正しい出力色が生成され、これはカラーフォーマットユニット226によって他の色表現にさらに変換される。   The reading unit (277) then allows the coarse mapping unit 202 to reconstruct the HDR image from the appropriate function that was used to encode the HDR / LDR look image pair together, ie, the received LDR image. For example, passing parameters or supplying functions as LUTs. The accurately scaled luma Y′o obtained by applying (at least) three-interval curve mapping is then used as an input multiplier to multiply each of the three scaled color components to produce the correct output color. This is generated and further converted by the color format unit 226 into another color representation.

粗マッピングユニット(202)の良好な実施形態は、たとえば図3のような関数を適用する。放物線区間の位置は、開始及び終了ルマ値を符号化することによって決定されるが、放物線は図3のようにその幅として符号化することもできる。入力は、この例では非限定的に、線形RGB表現の輝度、すなわちu_HDR_inであり、出力TU_LDR_outは、所望であれば特定用途のシステムにおいて後で、ユニット203のカスタム形状曲線によって微調整するか、或いは乗算器に送信して、処理中のこのピクセルの正しいHDR色を取得することができるものである。   A preferred embodiment of the coarse mapping unit (202) applies a function such as that shown in FIG. The position of the parabola section is determined by encoding the start and end luma values, but the parabola can also be encoded as its width as in FIG. The input is, in this example, without limitation, the luminance of the linear RGB representation, i.e. u_HDR_in, and the output TU_LDR_out can be fine-tuned later by the custom shape curve of unit 203 in the application-specific system if desired, Alternatively, it can be sent to a multiplier to obtain the correct HDR color for this pixel being processed.

この実施形態では、基本的な「放物線」トーンマッピング曲線は3つの区間:
− 傾きbet又はbg(ベースゲイン)のパラメータによって制御される(0,0)を通る暗区間と、
− 傾きalph又はdg(差動ゲイン)を有する(u_max,TU_max)を通る明区間と、
− 幅xp(x幅の放物線)を有するその2つをつなぐ放物線区間と
からなる。
In this embodiment, the basic “parabolic” tone mapping curve has three intervals:
A dark interval through (0,0) controlled by a parameter of slope bet or bg (base gain);
A light interval through (u_max, TU_max) with slope alpha or dg (differential gain);
A parabolic section connecting the two with a width xp (a parabola of x width).

放物線がなければ、2つの線形区間は点
um=(TU_max−dg*u_max)/(bg−dg)、
TUm=bg*um=TU_max−(u_max−um)*dg
においてつながる。
Without a parabola, the two linear intervals are the points um = (TU_max−dg * u_max) / (bg−dg),
TUm = bg * um = TU_max- (u_max-um) * dg
Connect in

これ(um,TUm)を中心とする放物線を追加することで、連続的に微分可能な曲線を作成し、これは傾き=bgで始まり、傾き=dgで終わらなければならない。数学的計算から、(3のうちの)1自由度、すなわち、放物線の幅xpのみが残されることを得る。   Adding a parabola centered on this (um, TUm) creates a continuously differentiable curve, which must start with slope = bg and end with slope = dg. From the mathematical calculation it is obtained that only one degree of freedom (out of three), ie the parabola width xp is left.

幅に応じて、u=umでのy値は、
up=0でのTU=TUmから、
TU=TUm−delta_TU=TU−up*(bg−dg)/8まで低下する。
Depending on the width, the y value at u = um is
From TU = TUm at up = 0,
TU = TUm-delta_TU = TU-up * (bg-dg) / 8.

この関係を反転して、delta_TUからupを計算することができる:
up=8*delta_TU/(bg−dg)
This relationship can be reversed to calculate up from delta_TU:
up = 8 * delta_TU / (bg-dg)

したがって、典型的には、up=0から開始し、次いで屈曲曲線と、基準輝度マッピング曲線(散布図)との間の最大距離delta_TUを調べ、これからupを計算することができる。   Thus, typically, starting from up = 0, the maximum distance delta_TU between the bending curve and the reference luminance mapping curve (scatter plot) can then be examined and up can be calculated therefrom.

したがって、この実施形態では、放物線区間の幅(典型的には、0.0〜1.0の間)は、ベースゲインの傾き(たとえば、典型的な値は、明るい画像の場合の0.5と、暗い画像の場合の1.0との間である)と、最も明るい入力範囲の傾き(典型的には0.0〜0.25の間)とに加えて任意の受信側装置に伝達される、この関数形状を指定する第3のパラメータとなる。   Thus, in this embodiment, the width of the parabolic interval (typically between 0.0 and 1.0) is the slope of the base gain (eg, a typical value is 0.5 for bright images). And 1.0 for darker images) and the slope of the brightest input range (typically between 0.0 and 0.25) in addition to any receiving device The third parameter for designating this function shape.

図4では、将来のHDRシステム(たとえば、1000nitPBディスプレイに接続されるもの)が正しく処理できる必要がある、すなわち、いかなるディスプレイが接続されるか又は接続が想定されるかに関わらず、画像内の、最終的にレンダリングされる画像内の全ての物体/ピクセルについて適切な輝度を作成できる必要がある多数の可能なHDRシーンの2つの例のみを示している。たとえば、ImSCN1はテキサス州で上映しているカウボーイ映画の晴れた屋外の画像であり、ImSCN2は夜間の画像である。HDR画像レンダリングを、ごく最近終了した(又は実際には今後数年で市場で始まる予定である)LDR時代におけるそのいつもの態様と異ならせるものは、LDRがそのような限られたダイナミックレンジしか有していなかったこと(およそPB=100nit、及び黒レベル±1nit、又は画面反射によるより明るい視聴環境ではさらに高くなる)、主に物体の反射率しか表示できなかったこと(これは良好な白の90%と良好な黒の1%との間に収まる)である。したがって、物体をその照明とは無関係に表示しなければならず、起こり得るシーンの大変良好で時折非常にコントラストの高い照明の全てを同時に忠実に表示することはできなかった。実際には、それは、非常に明るい晴れたシーンは、どんよりした雨の日のシーンと同一の表示輝度(0〜100nit)でレンダリングされなければならなかったことを意味していた。また、夜間のシーンでさえもあまりに暗くレンダリングすることはできず、又は、視聴者は画像の最も暗い部分をうまく識別することもできないので、やはりそれらの夜間の明度も0〜100nitの範囲にわたってレンダリングされる。したがって、従来は夜のシーンを青く色付けして、視聴者が昼間のシーンを見ているのではないと理解できるようにしなければならなかった。さて、もちろん実生活では、人間の視覚も利用可能な光量に適応するが、それほどではない(ほとんどの人は実生活で暗くなってきたことを認識する)。したがって、少なくとも利用可能なHDRディスプレイを有する場合に、芸術的に内部にデザイン可能な全ての壮大な局所照明効果を使用して画像をレンダリングすることを望む。   In FIG. 4, the future HDR system (eg, connected to a 1000 nit PB display) needs to be able to handle correctly, i.e., regardless of what display is connected or expected to be connected. Only two examples of the many possible HDR scenes that need to be able to create appropriate brightness for all objects / pixels in the final rendered image are shown. For example, ImSCN1 is a sunny outdoor image of a cowboy movie showing in Texas, and ImSCN2 is a night image. What makes HDR image rendering different from its usual aspect in the LDR era, which has just finished (or is actually scheduled to start in the next few years), is that LDR has such a limited dynamic range. (Approx. PB = 100 nit, and black level ± 1 nit, or higher in brighter viewing environment due to screen reflection), mainly reflecting only the reflectance of the object (this is a good white 90% and good black 1%). Therefore, the object had to be displayed independently of its illumination, and it was not possible to faithfully display all the very good and sometimes very high-contrast illuminations of a possible scene. In practice, it meant that very bright sunny scenes had to be rendered with the same display brightness (0-100 nits) as the overcast rainy day scene. Also, even night scenes cannot be rendered too dark, or viewers are not able to identify the darkest part of the image well, so they are also rendered over a range of 0-100 nits. Is done. Therefore, conventionally, the night scene must be colored blue so that the viewer can understand that he is not watching the daytime scene. Now, of course, in real life, human vision also adapts to the amount of light available, but not so much (most people recognize that it has become darker in real life). Therefore, it is desirable to render an image using all the magnificent local lighting effects that can be artistically designed internally, at least with an available HDR display.

しかしながら、それは、一部の人々にとってはまだ、素晴らしい新たなHDR映画をその制限されたLDRディスプレイ(その範囲は、正確な縮尺ではないが図4の右側に示されている)にダウングレードする必要があるという事実を変えない。   However, it is still necessary for some people to downgrade a wonderful new HDR movie to its limited LDR display (the range is shown to the right of FIG. 4 but not to scale) Does not change the fact that there is.

したがって、左側で、5000nitPBの(すなわち、5000nitPBディスプレイでのレンダリングに最適化された)マスターHDRグレーディングにおいて見たい物体輝度を確認する。ただの錯覚ではなく、カウボーイが明るい太陽に照らされた環境にいる本当の感覚を伝えたい場合、その輝度を、たとえば500nit付近に指定しレンダリングする必要がある。これらの例のみから、より小さいLDR輝度範囲で全ての物体のパズルをつなぎ合わせることが、理想的には単純な圧縮(たとえば、線形関数によってHDRのPBをLDRのPBにマッピングし、それによってより低い輝度全てもマッピングする)の問題ではないという感覚を既に得ることができる。反対に、異なる輝度マッピング−挙動クラスの2つの例を与える。日中のシーンでは、受信されたLDR画像からHDR画像を計算したい場合、具体的には、18nitのLDR中間グレー付近にレンダリングされるカウボーイがHDRで500nitにマッピングされるように(すなわち、約30倍の明度増加)、全ての輝度を引き伸ばす伸張関数を実際に適用することができる。しかしながら、夜のシーンではそうすることを望まず、又はHDRモニタでは途方もなく明るくなる(実際に細部に飛び込むと、一部の画像の詳細によって、明るすぎる場合であっても、脳は夜のシーンを見ているとまだ想像し得るが、今や可能となった、壮大で高品質のHDRレンダリングを本当に望む場合、それは理想とは程遠くレンダリングされる)。このImSCN2では、夜の全ての暗い物体の輝度が2つのディスプレイ(及び中間PBの全てのディスプレイ)で同一になることを望む。むしろ、HDR画像で非常に明るい輝度に明るくされるのは照明用ポールの光であり、月かもしれない。したがって、輝度マッピング関数の形状は大きく異なる。それら2つの典型的な画像の態様を共に、たとえば、洞窟の中で撮影され、小さい穴を通して晴れた屋外を見る、1つの画像内に有する場合、複雑な輝度マッピング曲線を実際に設計して、自身の芸術的欲求に応じたLDR及びHDR両方の物体輝度を得たいと思う場合がある。そのような状況がLDR時代に典型的にはどのように起こったのかは、洞窟の外の全てを白にクリップしただけである。又は、LDR時代には、カメラが相対的な輝度としてその意味とは無関係に撮影したもの、及びいかなるディスプレイ上でもそれらを最終的にレンダリングするためにそれが暗示するものをただ考えていたので、画像の一部が暗くなりすぎることが多かった。たとえば、廊下を歩き太陽が差し込むのを見た場合、これらの太陽があたった場所は非常に明るく見える。廊下の他の部分は比較的暗いが、これはそこを歩く人にはそれらが通常より暗く見えることを意味しない(実際には追加の照明のために、影の部分でさえ、太陽が雲の後ろに移動した場合よりもいくらか明るく見える)。しかしながら、これらの日当たりの良い色を白付近に置くLDRレンダリングは、廊下の影部分を過度に暗くレンダリングするしかできず、その理由は、そうでなければ、限られた範囲で可能な唯一のことは、影を妥当な輝度でレンダリングするが、太陽の中の全てが、最大ルマ符号、たとえば255を超えてクリップされ、100nitでレンダリングされるためである。   Thus, on the left side, we identify the object brightness we want to see in a master HDR grading of 5000 nitPB (ie optimized for rendering on a 5000 nitPB display). If it is not just an illusion, but wants to convey the true feeling that the cowboy is in a bright sunlit environment, the brightness needs to be rendered, for example, near 500 nits. From these examples alone, splicing all object puzzles with a smaller LDR luminance range is ideally a simple compression (eg, mapping a HDR PB to a LDR PB by a linear function, thereby We can already get the feeling that it is not a problem of mapping all low luminance. Conversely, two examples of different luminance mapping-behavior classes are given. In daytime scenes, if you want to calculate HDR images from received LDR images, specifically, cowboys rendered near 18 nits of LDR mid-gray are mapped to 500 nits in HDR (ie, approximately 30 nits). Double the increase in brightness), it is possible to actually apply a stretching function that stretches all the brightness. However, you don't want to do that in the night scene, or it becomes tremendously bright on the HDR monitor (if you actually jump into the details, some image details may cause the brain to You can still imagine watching the scene, but if you really want the spectacular, high quality HDR rendering that is now possible, it renders far from ideal). In this ImSCN2, we want the brightness of all dark objects at night to be the same on the two displays (and all displays in the intermediate PB). Rather, it is the light of the lighting pole that may be brightened to very bright brightness in the HDR image, and may be the moon. Therefore, the shape of the luminance mapping function is greatly different. If you have both of these two typical image aspects together, for example in a single image taken in a cave and looking at a sunny outdoors through a small hole, you can actually design a complex intensity mapping curve, You may want to obtain both LDR and HDR object brightness according to your artistic desires. How such a situation typically occurred in the LDR era was simply clipping everything outside the cave to white. Or in the LDR era, we were only thinking about what the camera took as a relative brightness, regardless of its meaning, and what it implied to ultimately render on any display, Part of the image was often too dark. For example, if you walk down the corridor and see the sun coming in, the places that are hit by the sun look very bright. Other parts of the corridor are relatively dark, but this does not mean that those who walk there will see them appear darker than usual (actually because of the additional lighting, even in shadows, the sun It looks somewhat brighter than if you move backwards). However, LDR rendering with these sunny colors near white can only render shadows in the hallway too dark, because otherwise it is the only thing possible in a limited range Because it renders shadows with reasonable brightness, but everything in the sun is clipped beyond the maximum luma code, eg, 255 and rendered at 100 nits.

したがって、そのようなシーンの最適なLDRレンダリングは複雑な設計の問題であるが、少なくとも現在はHDRディスプレイによって、日当たりの良い部分をリアルに、すなわち特定の輝度を超えてレンダリングすることができる。たとえば、視聴環境がおよそ200nitに対応する場合、画像の影部分を200nit付近にレンダリングすることができる。また、日光のあたる部分を、ディスプレイのPBに応じて、たとえば2000nitにレンダリングすることができる。それは必ずしも常に、影の輝度を上回る実生活と全く同一の相対量ではないとしても、少なくとも、暗すぎる廊下又はクリップよりもはるかにリアルに見える。   Thus, optimal LDR rendering of such scenes is a complex design issue, but at least now with HDR displays, sunny parts can be rendered realistically, ie beyond a certain brightness. For example, when the viewing environment corresponds to approximately 200 nits, the shadow portion of the image can be rendered near 200 nits. Further, a portion exposed to sunlight can be rendered at, for example, 2000 nits according to the PB of the display. It always looks much more realistic than a corridor or clip that is too dark, if not always the same relative amount as real life above the shadow brightness.

しかしながら、読者であれば、この複雑さの全て、具体的には遭遇し得る多数の種類の画像、及び少なくともいくつかのより高品質のHDR範囲(たとえばPB=10,000nit)とSDR100nit範囲との大きな差が、種々のピクセル色、及び特にその輝度の正確な指定を可能にするシステムを要求する理由を理解する。また、出願人は特に、コンテンツクリエータが、どのように任意の他のダイナミックレンジ画像が受信された画像から計算されるかに対して、少なくともそう望む者にとって、そうしたい程度まで、最小限指定する必要がある程度まで、影響を与えられるようにすべきであるという哲学を有していた。   However, the reader should consider all of this complexity, specifically the many types of images that may be encountered, and at least some higher quality HDR ranges (eg PB = 10,000 nits) and SDR 100 nit ranges. Understand why the large differences require a system that allows for the precise specification of different pixel colors and in particular their brightness. Applicants also specifically specify, to the extent that content creators want to do so, at least for those who want it, at least for how any other dynamic range image is calculated from the received image. He had a philosophy that should be influenced to some extent necessary.

図5は、HDR画像の通信及び消費のためのある典型的な完全なシステム又はチェーンにおける我々の基本的な輝度変更装置(又は方法)の可能な組み込みを示す。当業者は、どのようにしてグレーダなどがUIコンポーネントを使用して、任意の関数の形状、たとえばそれらを特徴付けるパラメータを、自身のニーズ又は要望に応じて変更することができるかを理解するであろう。モードiiの例(コンテンツクリエータが自身のRAWキャプチャから作成したマスターHDR画像MAST_HDRからダウングレードされたLDR画像が実際に通信され、次いで受信側で必要な場合にMAST_HDR画像の近似に再構成される)を説明するが、システム及び我々の装置の実施形態は、MAST_HDR画像が実際に通信され、SDRディスプレイに供給するためにLDR画像が必要な場合に、装置が受信機において輝度ダウングレードを適用するモードi動作においても使用することができることを強調したい。これらの受信されたLDR又はHDR画像のそれぞれは、1499nitPBなどの異なるダイナミックレンジの画像に変換することもできる。また、装置の実施形態を作成側の装置、たとえば符号化器に組み込んで、たとえば、カラーグレーダが、受信側で何が起こるか、及び所与の関数によってMAST_HDRから計算されたLDR画像がどのように見えるかを確認できるようにすることもでき、装置及び方法は、たとえば、ローカルコンテンツ配信業者の視聴ブースなど、任意の中間位置のトランスコーダで使用することもできる。   FIG. 5 shows a possible integration of our basic brightness changing device (or method) in one typical complete system or chain for communication and consumption of HDR images. Those skilled in the art will understand how graders and the like can use UI components to change the shape of any function, for example the parameters that characterize them, according to their needs or desires. Let's go. Example of mode ii (the LDR image downgraded from the master HDR image MAST_HDR created by the content creator from its own RAW capture is actually communicated and then reconstructed to approximate the MAST_HDR image if needed on the receiving side) However, the embodiment of the system and our device is a mode in which the device applies a luminance downgrade at the receiver when the MAST_HDR image is actually communicated and an LDR image is required to feed the SDR display. I want to emphasize that it can also be used in i-motion. Each of these received LDR or HDR images can also be converted to an image with a different dynamic range, such as 1499 nitPB. Also, an embodiment of the device may be incorporated into a creating device, eg, an encoder, for example, what happens to a color grader at the receiving side, and how an LDR image calculated from MAST_HDR by a given function. The device and method can also be used in any intermediate location transcoder, such as a local content distributor viewing booth, for example.

この例示的な方式のビデオ符号化器501は、入力509を介して入力画像IM_INを取得し、これは説明を簡単にするために既に芸術的に作成されたマスターHDRグレーディングであると仮定するが、あるRAW画像フィードからのHDR画像でもよく、これはリアルタイムの障害がほとんどなく、おそらく撮影中に数回ノブをダイヤルするだけで、最小限に色処理される必要がある。   This exemplary scheme video encoder 501 obtains an input image IM_IN via input 509, which is assumed to be a master HDR grading already artistically created for ease of explanation. It may be an HDR image from a RAW image feed, which has little real-time obstruction and probably needs to be minimally color processed with a few dials during shooting.

色彩処理ユニットによってピクセル色に対して計算される色彩処理が含まれてもよく、たとえば、彩度を低下させる彩度変化であって、LDR変換において、たとえばステンドグラスの窓のより明るい色を、白付近のLDR色域の狭い頂部に押し込むことによって追加で明るくできるようにするものがあるが、その詳細については説明しない。次いで、輝度マッピングユニット503は、我々の装置の実施形態のいずれかが図2に示されるように行う様々なことを行い、現在の画像セットについて決定され、たとえば、ユーザインタフェースインタラクションによって、又は以前に決定された関数を符号化したメタデータからロードされる、輝度均一化、そして3部分曲線、及び適用可能な場合には、ある最適形状の関数CCなどを行う。いくつかの実施形態は、画像分析ユニット566に画像の特性、たとえば、ピクセル輝度の大部分の場所、ハイライトパッチのサイズ及び散乱などを分析させることによって、3部分曲線の形状を決定する。関数入力手段508は、たとえば、典型的なカラーグレーディングツール、若しくは少なくとも1つの関数を記憶するデータベースへの接続、又は遠隔の人間のグレーダへの接続などと、読者が理解することができる。そして、この中間画像IMEDは、現在この例では、0〜100nitのLDR範囲に分布したピクセル輝度と、それらに対応するRec.709ルマ(すなわち、図示のY’oUV)とを有するLDR画像であり、画像又はビデオ符号化ユニット505によって典型的なレガシーLDR符号化技術、たとえばHEVCで符号化される。この理由は、実際にはHDRシーンのHDR画像を符号化したものであるにもかかわらず、少なくとも後続の技術、たとえば、通過する画像配信パイプラインなどにとって、通常のLDR画像のように「見える」ためである。これを任意の受信機に、マスターHDR画像からLDR画像を生成するために使用された色変換関数(又はその逆関数)も送信することによって伝え、これは、通常のLDR画像の代わりにHDR画像を実際に受信したことを受信機に伝えるだけでなく、受信機が、受信された逆関数を受信されたLDR画像に適用することによって、MAST_HDR画像の近似を再構成することを可能にする。したがって、符号化された画像又はビデオLDR_oencは、実際には、システムの残りの部分に対しては通常のLDRビデオとして機能し、ある通信手段510を通って移動し、これはたとえば、空中放送、インターネット接続、又はいかなる消費者若しくは専門家(たとえば、映画)の場所にも輸送される物理メモリなどである。   Color processing calculated for the pixel color by the color processing unit may be included, for example, a saturation change that reduces the saturation, in the LDR transform, for example a brighter color in a stained glass window, There are things that can be additionally brightened by pushing into the narrow top of the LDR color gamut near white, but the details are not described. The luminance mapping unit 503 then does various things that any of our device embodiments do as shown in FIG. 2 and is determined for the current image set, eg, by user interface interaction or previously Load the determined function from the encoded metadata, perform brightness uniformity, and tripartite curves, and if applicable, a function CC of some optimal shape. Some embodiments determine the shape of the three-part curve by having the image analysis unit 566 analyze the characteristics of the image, such as the location of most of the pixel brightness, the size and scattering of highlight patches, and the like. The function input means 508 can be understood by the reader as, for example, a typical color grading tool, or a connection to a database that stores at least one function, or a connection to a remote human grader. In this example, the intermediate image IMED is currently represented by pixel luminances distributed in the LDR range of 0 to 100 nit and the corresponding Rec. 709 luma (ie, Y'oUV as shown) and is encoded by the image or video encoding unit 505 with a typical legacy LDR encoding technique such as HEVC. The reason for this is that it “looks” like a normal LDR image, at least for subsequent technologies, such as the passing image distribution pipeline, although it is actually an HDR image encoding of the HDR scene. Because. This is communicated to any receiver by also sending the color conversion function (or its inverse) used to generate the LDR image from the master HDR image, which is an HDR image instead of the normal LDR image. As well as allowing the receiver to reconstruct the approximation of the MAST_HDR image by applying the received inverse function to the received LDR image. Thus, the encoded image or video LDR_oenc actually acts as a normal LDR video for the rest of the system and travels through some communication means 510, for example, Such as an internet connection or physical memory transported to any consumer or professional (eg movie) location.

受信端では、この符号化された出力画像(LDR_oenc)は、入力画像又はビデオLDR_iencとなる(これはさらなる変換をさらに受けている場合があるが、説明のために、ループスルーされた同一の画像であると仮定する)。LDR_oencでモードiのHDR通信システムを使用する場合、モードiiとは異なる形状の関数を使用して、画像に異なる物体明度及び統計を与えるが、共にHEVC符号化などが行われることにすぐに気付くべきである。   At the receiving end, this encoded output image (LDR_oenc) becomes the input image or video LDR_ienc (which may have undergone further transformation, but for purposes of explanation, the same image that has been looped through) Is assumed to be). When using an HDR communication system in mode i with LDR_oenc, a function with a shape different from that in mode ii is used to give different image brightness and statistics to the image, but it is immediately noticed that HEVC encoding and the like are both performed. Should.

ビデオ復号器550は、その入力556を介して、画像と、関数を符号化したメタデータMET(F)、具体的には、たとえばカラーグレーダ又はライフプロダクションの技術ディレクターなどのある他の人物によって作成側で選択された最適なカスタム曲線との両方を取得する。画像又はビデオ復号ユニット(555)はHEVCビデオを復号し、次いでこれは、我々の装置又は方法の実施形態のいずれかを具現化する輝度マッパー552によって色処理される(すなわち、少なくとも近似的にHDR画像を再構成するための適切な逆3部分関数を適用する)。最後に、正しくグレーディングされたREC_HDR、たとえば5000nitPB画像は、ディスプレイ580、たとえば理想的には5000nitディスプレイに送ることができる(HDRコンテンツとディスプレイとの間でPBが一致しない場合、たとえばSTBに具現化されたこのビデオ復号器は、必要とされるたとえば2500nitディスプレイPBまで適切な色変換によって画像を既に表示調整しており、又は、ディスプレイがそれを内部的に、我々が教示した装置/方法の独自のバージョン有することによって行う)。もちろん、レガシーSDR100nitディスプレイに適切にグレーディングされたコンテンツが供給される場合、ビデオ復号器550はLDR画像LDR_rndをそれに供給し、これはこの例では単に、さらなる色変換の必要がない復号器で受信されたLDR画像であるが、LDR HEVCコンテナ内でHDR画像を受信した場合、ビデオ復号器550は、我々の装置/方法の実施形態のいずれかに従って適切なダウングレードをさらに行う。   The video decoder 550, via its input 556, is created by an image and some other person, such as metadata MET (F) encoding the function, specifically a color grader or a technical director of life production, for example. Get both the best custom curve selected on the side. The image or video decoding unit (555) decodes the HEVC video, which is then color processed (ie, at least approximately HDR) by a luminance mapper 552 that embodies any of our apparatus or method embodiments. Apply the appropriate inverse tripartite function to reconstruct the image). Finally, a correctly graded REC_HDR, eg, a 5000 nit PB image, can be sent to a display 580, eg, ideally a 5000 nit display (if the PB does not match between the HDR content and the display, for example, embodied in an STB. This video decoder has already displayed the image with the appropriate color conversion up to the required, eg 2500 nit display PB, or the display does it internally, the proprietary of the device / method we have taught Do by having a version). Of course, if properly graded content is supplied to the legacy SDR 100 nit display, the video decoder 550 supplies it with the LDR image LDR_rnd, which in this example is simply received at the decoder that does not require further color conversion. If an HDR image is received in an LDR HEVC container, the video decoder 550 further performs an appropriate downgrade according to any of our device / method embodiments.

本文書で開示されたアルゴリズムの構成要素は、実際にはハードウェア(たとえば、特定用途向けICの部分)として、又は専用のデジタル信号プロセッサ若しくは汎用プロセッサ上で動作するソフトウェアとして(完全に又は部分的に)実現される。それらは、少なくとも何らかのユーザ入力(たとえば、工場で、若しくは消費者の入力、又は他の人間の入力)が存在する/しているという意味で半自動である。   The algorithmic components disclosed in this document may actually be implemented as hardware (eg, part of an application specific IC) or as software running on a dedicated digital signal processor or general purpose processor (fully or partially) To be realized. They are semi-automatic in the sense that at least some user input exists (eg, at the factory or consumer input, or other human input).

どの構成要素が任意選択の改良であり、他の構成要素と組み合わせて実現され得るか、また、どのように方法の(任意選択の)ステップが装置のそれぞれの手段に対応するか、及びその逆は、本提案から当業者には理解できるはずである。いくつかの構成要素が本発明において特定の関係で(たとえば、ある構成の1つの図に)開示されているという事実は、本明細書で特許取得のために開示された同一の発明思想の下での実施形態として他の構成が可能でないことを意味するものではない。また、実際的な理由で、限られた範囲の例しか記載されていないという事実は、他の変形形態が特許請求の範囲に入ることができないことを意味するものではない。実際には、本発明の構成要素は、任意の使用チェーンに沿った異なる変形形態で具現化することができ、たとえば、符号化器のような作成側の全ての変形形態は、復号器などの分解されたシステムの消費側の対応する装置に類似又は対応し、逆も同様である。実施形態のいくつかの構成要素は、符号化器及び復号器の間の任意の伝送技術において、伝送されるか又は協調などにさらに使用される信号内に、特定の信号データとして符号化される。本出願における「装置」という単語は、最も広い意味で使用され、すなわち、特定の目的の実現を可能にする手段のグループであり、したがって、たとえば、IC(の小部分)、専用機器(たとえば、ディスプレイを有する機器)、又はネットワーク接続されたシステムの一部などとすることができる。「構成」又は「システム」も、最も広い意味でも使用されることが意図されているので、とりわけ、単一の物理的な購入可能な装置、装置の一部、協働する装置(の一部)の集合体などを含む。   Which components are optional improvements and can be implemented in combination with other components, and how the (optional) steps of the method correspond to the respective means of the apparatus and vice versa Will be understood by those skilled in the art from this proposal. The fact that several components are disclosed in a particular relationship in the present invention (eg, in one diagram of a configuration) is based on the same inventive concept disclosed herein for patenting. This does not imply that other configurations are not possible as an embodiment. The fact that, for practical reasons, only a limited range of examples is given does not mean that other variants cannot fall within the scope of the claims. In practice, the components of the present invention can be embodied in different variations along any chain of use, for example, all variations on the producer side, such as an encoder, are decoders, etc. Similar or corresponding to the corresponding device on the consumer side of the disassembled system, and vice versa. Some components of the embodiments are encoded as specific signal data in a signal that is transmitted or further used for coordination, etc., in any transmission technique between the encoder and decoder. . The word “apparatus” in the present application is used in the broadest sense, ie a group of means enabling the realization of a specific purpose, and thus for example IC (a small part of), dedicated equipment (eg A device having a display), or part of a networked system. A “configuration” or “system” is also intended to be used in the broadest sense, so that, among other things, a single physical purchaseable device, part of a device, part of a cooperating device (part of ).

コンピュータプログラム製品の表記は、汎用又は専用プロセッサが、一連のローディングステップ(これは中間変換ステップ、たとえば、中間言語及び最終的なプロセッサ言語への変換を含む)の後に、コマンドをプロセッサに入力して発明の特徴的な機能のいずれかを実行することを可能にする、コマンドの集合の任意の物理的実現を包含するものと理解されるべきである。具体的には、コンピュータプログラム製品は、たとえばディスク又はテープなどのキャリア上のデータ、メモリに存在するデータ、有線又は無線のネットワーク接続を介して移動するデータ、又は紙面上のプログラムコードとして実現される。プログラムコードとは別に、プログラムに必要な特徴データもコンピュータプログラム製品として具現化される。そのようなデータは任意の手法で(部分的に)供給される。   The notation of a computer program product is that a general purpose or special purpose processor enters a command into the processor after a series of loading steps (which includes intermediate conversion steps, eg, conversion to intermediate language and final processor language). It should be understood to encompass any physical realization of a set of commands that allows performing any of the characteristic functions of the invention. Specifically, a computer program product is implemented as data on a carrier such as a disk or tape, data residing in a memory, data traveling via a wired or wireless network connection, or program code on paper. . Apart from the program code, characteristic data necessary for the program is also embodied as a computer program product. Such data is (partially) supplied in any manner.

本発明、又はビデオデータのような本実施形態の任意の哲学に従って使用可能な任意のデータも、データキャリア上の信号として具現化され、これはリムーバブルメモリ、たとえば、光ディスク、フラッシュメモリ、リムーバブルハードディスク、無線手段を介して書き込み可能なポータブルデバイスなどである。   Any data that can be used in accordance with the present invention or any philosophy of this embodiment, such as video data, is also embodied as a signal on a data carrier, which is removable memory such as an optical disk, flash memory, removable hard disk, A portable device writable via wireless means.

任意の提示された方法の動作に必要なステップのいくつかは、データ入力及び出力ステップ、よく知られている典型的には組み込みの処理ステップ、たとえば標準的なディスプレイ駆動など、コンピュータプログラム製品又は(本発明の実施形態の詳細と共に)本明細書に記載された任意のユニット、装置又は方法に記載される代わりに、プロセッサ又は本発明の任意の装置の実施形態の機能内に既に存在する。結果として得られる製品及び類似の成果物、たとえば、方法の任意のステップ又は装置の任意のサブパートに含まれる特定の新規な信号、並びにそのような信号の任意の新たな用途、又は任意の関連する方法に対する保護も所望する。   Some of the steps necessary for the operation of any presented method are computer program products such as data input and output steps, well-known and typically built-in processing steps such as standard display driving, or ( Instead of being described in any unit, apparatus or method described herein (along with details of an embodiment of the invention), it already exists within the functionality of the processor or any apparatus embodiment of the invention. The resulting product and similar products, such as specific new signals included in any step of the method or any subpart of the apparatus, and any new use of such signals, or any relevant Protection against the method is also desired.

上記の実施形態が本発明を限定するのではなく例示するものであることに留意されたい。当業者が提示された例を特許請求の範囲の他の領域にマッピングすることを容易に実現できる場合、簡潔にするために、これらの選択肢の全てを詳細に述べているわけではない。特許請求の範囲で組み合わせられた本発明の要素の組み合わせとは別に、要素の他の組み合わせも可能である。要素の任意の組み合わせを、単一の専用要素内で実現することができる。   It should be noted that the above embodiments are illustrative rather than limiting of the present invention. Not all of these options have been described in detail for the sake of brevity, if one skilled in the art can easily implement the examples presented to other areas of the claims. Apart from combinations of elements of the invention combined in the claims, other combinations of elements are possible. Any combination of elements can be realized in a single dedicated element.

請求項内の括弧内のいかなる参照符号も、その請求項を限定するものではなく、図面中の任意の特定のシンボルでもない。「備える」という単語は、請求項に記載されていない要素又は態様の存在を排除するものではない。要素に先行する単語「a」又は「an」は、複数のそのような要素の存在を排除するものではない。
Any reference sign between parentheses in the claim does not limit the claim and is not any specific symbol in the drawings. The word “comprising” does not exclude the presence of elements or aspects not listed in a claim. The word “a” or “an” preceding an element does not exclude the presence of a plurality of such elements.

Claims (15)

第1の輝度ダイナミックレンジを有する入力画像のピクセルの入力色を、第2の輝度ダイナミックレンジを有する出力画像のピクセルの赤、緑及び青の色成分の出力色に変換する画像色処理装置を備える、HDRビデオ復号器であって、
前記第1の輝度ダイナミックレンジのピーク輝度が前記第2の輝度ダイナミックレンジのピーク輝度より少なくとも2倍低いか又はその逆であり、
前記画像色処理装置は、傾き変数によって決定される最も暗い入力ルマ値を含む入力画像色のルマの範囲の暗いサブレンジのための線形区間と、第2の傾き変数によって制御される明るいサブレンジにおける最も明るい入力ルマ値のための第2の線形区間と、これら2つの線形区間の間の放物線区間とを含む3区間明度再グレーディング曲線を適用する粗マッピングユニットを備える、HDRビデオ復号器。
An image color processing apparatus that converts an input color of a pixel of an input image having a first luminance dynamic range into an output color of red, green, and blue color components of a pixel of the output image having a second luminance dynamic range. An HDR video decoder comprising:
The peak luminance of the first luminance dynamic range is at least twice lower than the peak luminance of the second luminance dynamic range, or vice versa,
The image color processing device includes a linear interval for the dark subrange of the luma range of the input image color including the darkest input luma value determined by the slope variable, and a lightest subrange controlled by the second slope variable. An HDR video decoder comprising a coarse mapping unit that applies a three-interval lightness grading curve including a second linear interval for a bright input luma value and a parabolic interval between the two linear intervals.
前記画像色処理装置が、前記3区間明度再グレーディング曲線を低ダイナミックレンジルマに適用する、請求項1に記載のHDRビデオ復号器。   The HDR video decoder according to claim 1, wherein the image color processing device applies the three-section lightness grading curve to a low dynamic range luma. 前記画像色処理装置が、Nが2の場合を含む指数1/Nのべき関数によって前記3区間明度再グレーディング曲線を前記入力色に適用した出力結果である色の輝度に関連する出力ルマを、前記3区間明度再グレーディング曲線を適用した結果として生成する、請求項1又は2に記載のHDRビデオ復号器。   The image color processing apparatus outputs an output luma related to the luminance of a color as an output result obtained by applying the three-section lightness grading curve to the input color by a power function of an index 1 / N including a case where N is 2. The HDR video decoder according to claim 1 or 2, which is generated as a result of applying the three-section lightness grading curve. 前記画像色処理装置が、出力ルマを乗算係数とする乗算を、現在処理中のピクセルの色の好ましい非線形の色表現に適用する乗算器を備えることによって、前記出力色を決定する、請求項1乃至3の何れか一項に記載のHDRビデオ復号器。   2. The output color is determined by the image color processing device comprising a multiplier that applies a multiplication with an output luma as a multiplication factor to a preferred non-linear color representation of the color of the pixel currently being processed. The HDR video decoder as described in any one of thru | or 3. 前記画像色処理装置が、平方根関数に近い形状であって、Nを整数値とする指数1/Nのべき関数である非線形関数によって線形R、G、B色成分から技術的に定義される非線形の色表現を得る、請求項1乃至4の何れか一項に記載のHDRビデオ復号器。   The image color processing device has a shape close to a square root function and is technically defined from linear R, G, and B color components by a nonlinear function that is a power function of an exponent 1 / N where N is an integer value. The HDR video decoder according to claim 1, which obtains a color representation of 受信されたメタデータから前記傾き変数及び前記第2の傾き変数を読み取り、それを前記粗マッピングユニットに供給する読み取りユニットを備える、請求項1乃至5の何れか一項に記載のHDRビデオ復号器。 6. The HDR video decoder according to claim 1, comprising a reading unit that reads the slope variable and the second slope variable from received metadata and supplies them to the coarse mapping unit. 7. . 前記読み取りユニットがさらに、受信されたメタデータから前記2つの線形区間の間の放物線領域の幅を読み取り、それを前記粗マッピングユニットに供給する、請求項6に記載のHDRビデオ復号器。   The HDR video decoder according to claim 6, wherein the reading unit further reads the width of a parabolic region between the two linear intervals from received metadata and supplies it to the coarse mapping unit. 連続した画像の復号器HDRビデオを生成するビデオ復号の方法であって、傾き変数によって決定される最も暗い入力ルマ値を含む入力画像色のルマの範囲の暗いサブレンジのための線形区間と、第2の傾き変数によって制御される明るいサブレンジにおける最も明るい入力ルマ値のための第2の線形区間と、これら2つの線形区間の間の放物線区間とを含む3区間明度再グレーディング曲線を適用して、色変換される入力色の好ましい非線形のRGB色表現との乗算に供給される出力ルマを生成するステップを有する、方法。   A method of video decoding to generate a continuous image decoder HDR video, a linear interval for a dark subrange of a luma range of input image colors including a darkest input luma value determined by a slope variable; Applying a three-segment lightness grading curve that includes a second linear interval for the brightest input luma value in the bright subrange controlled by a slope variable of two and a parabolic interval between the two linear intervals; Generating an output luma that is provided for multiplication with a preferred non-linear RGB color representation of the color-converted input color. 第2の輝度ダイナミックレンジを有する入力画像のピクセルの入力色を、第1の輝度ダイナミックレンジを有する出力画像のピクセルの出力色に変換する画像色処理装置を備える、HDRビデオ符号化器であって、
前記第1の輝度ダイナミックレンジのピーク輝度が前記第2の輝度ダイナミックレンジのピーク輝度より少なくとも2倍低いか又はその逆であり、
前記画像色処理装置は、傾き変数によって決定される最も暗い入力ルマ値を含む入力画像色のルマの範囲の暗いサブレンジのための線形区間と、第2の傾き変数によって制御される明るいサブレンジにおける最も明るい入力ルマ値のための第2の線形区間と、これら2つの線形区間の間の放物線区間とを含む3区間明度再グレーディング曲線を適用する粗マッピングユニットを備える、HDRビデオ符号化器。
An HDR video encoder comprising an image color processing device for converting an input color of a pixel of an input image having a second luminance dynamic range into an output color of a pixel of an output image having a first luminance dynamic range. ,
The peak luminance of the first luminance dynamic range is at least twice lower than the peak luminance of the second luminance dynamic range, or vice versa,
The image color processing device includes a linear interval for the dark subrange of the luma range of the input image color including the darkest input luma value determined by the slope variable, and a lightest subrange controlled by the second slope variable. An HDR video encoder comprising a coarse mapping unit that applies a three-interval lightness grading curve including a second linear interval for bright input luma values and a parabolic interval between the two linear intervals.
前記画像色処理装置が、前記3区間明度再グレーディング曲線を非線形ドメインの前記入力色の色表現に適用する請求項9に記載のHDRビデオ符号化器において、
その色成分が、線形の赤、緑及び青の加法色成分に基づく非線形関数によって定義されることを特徴とする、HDRビデオ符号化器。
The HDR video encoder according to claim 9, wherein the image color processing device applies the three-section lightness grading curve to a color representation of the input color in a non-linear domain.
An HDR video encoder, characterized in that its color component is defined by a non-linear function based on linear red, green and blue additive color components.
前記画像色処理装置が、前記3区間明度再グレーディング曲線を前記入力色の線形の赤、緑及び青の色表現に適用する、請求項9に記載のHDRビデオ符号化器。   10. The HDR video encoder according to claim 9, wherein the image color processing device applies the three-interval lightness grading curve to linear red, green and blue color representations of the input color. 前記画像色処理装置が、非線形関数によって出力色の輝度に関連する非線形ルマを含む表現で前記出力色を決定する、請求項9乃至11の何れか一項に記載のHDRビデオ符号化器。   The HDR video encoder according to any one of claims 9 to 11, wherein the image color processing device determines the output color by an expression including a nonlinear luma related to luminance of the output color by a nonlinear function. 前記画像色処理装置が、標準ダイナミックレンジビデオ符号化によって定義される表現で前記出力色を決定する請求項9乃至12の何れか一項に記載のHDRビデオ符号化器であって、
出力ルマ色成分が、Rec.709光−電気伝達関数又は平方根によって定義されることを特徴とする、HDRビデオ符号化器。
13. The HDR video encoder according to any one of claims 9 to 12, wherein the image color processing device determines the output color with a representation defined by standard dynamic range video encoding.
The output luma color component is Rec. 709 HDR video encoder, characterized by being defined by an optical-electrical transfer function or square root.
低ダイナミックレンジ画像に符号化されるHDR画像セットを生成する、HDRビデオ符号化の方法であって、
第2の輝度ダイナミックレンジを有する入力画像のピクセルの入力色を、第1の輝度ダイナミックレンジを有する出力画像のピクセルの出力色に変換するステップであって、前記第1の輝度ダイナミックレンジのピーク輝度が前記第2の輝度ダイナミックレンジのピーク輝度より少なくとも2倍低いか又はその逆であるステップを有し、
前記変換するステップは、傾き変数によって決定される最も暗い入力ルマ値を含む入力画像色のルマの範囲の暗いサブレンジのための線形区間と、第2の傾き変数によって制御される明るいサブレンジにおける最も明るい入力ルマ値のための第2の線形区間と、これら2つの線形区間の間の放物線区間とを含む3区間明度再グレーディング曲線を適用するステップを有する、方法。
A method of HDR video encoding that generates an HDR image set that is encoded into a low dynamic range image comprising:
The input color pixel of an input image having a second luminance dynamic range, comprising the steps of converting the output color pixel of an output image having a first luminance dynamic range, the peak luminance of the first luminance dynamic range There at least 2-fold step is lower or vice versa from the peak luminance of the second luminance dynamic range,
The converting step includes a linear interval for the dark subrange of the luma range of the input image color including the darkest input luma value determined by the slope variable, and the brightest in the bright subrange controlled by the second slope variable. Applying a three-segment lightness grading curve comprising a second linear segment for the input luma value and a parabolic segment between the two linear segments.
プロセッサによって実行された場合に、請求項8又は14に記載の方法の全てのステップを実行するコードを含む、コンピュータ可読メモリ。   A computer readable memory comprising code that, when executed by a processor, performs all the steps of the method according to claim 8 or 14.
JP2018531233A 2015-12-17 2016-12-12 Dynamic range coding for images and video Active JP6495552B2 (en)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP15200630 2015-12-17
EP15200630.0 2015-12-17
PCT/EP2016/080538 WO2017102606A1 (en) 2015-12-17 2016-12-12 Dynamic range coding for images and video

Publications (2)

Publication Number Publication Date
JP2019504548A JP2019504548A (en) 2019-02-14
JP6495552B2 true JP6495552B2 (en) 2019-04-03

Family

ID=55024822

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018531233A Active JP6495552B2 (en) 2015-12-17 2016-12-12 Dynamic range coding for images and video

Country Status (12)

Country Link
US (1) US10152777B2 (en)
EP (1) EP3235236B1 (en)
JP (1) JP6495552B2 (en)
CN (1) CN107211079B (en)
BR (1) BR112017016037A2 (en)
ES (1) ES2684432T3 (en)
HU (1) HUE040383T2 (en)
MX (1) MX364488B (en)
PL (1) PL3235236T3 (en)
RU (1) RU2720446C2 (en)
WO (1) WO2017102606A1 (en)
ZA (1) ZA201704982B (en)

Families Citing this family (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015130793A1 (en) * 2014-02-25 2015-09-03 Apple Inc. Backward-compatible apparatus and method for providing video with both standard and high dynamic range
EP3244616A1 (en) * 2016-05-13 2017-11-15 Thomson Licensing A method for encoding an input video comprising a luma component and two chroma components, the method comprising reshaping of said input video based on reshaping functions
US10720091B2 (en) * 2017-02-16 2020-07-21 Microsoft Technology Licensing, Llc Content mastering with an energy-preserving bloom operator during playback of high dynamic range video
US10148907B1 (en) * 2017-10-27 2018-12-04 Avago Technologies International Sales Pte. Limited System and method of luminance processing in high dynamic range and standard dynamic range conversion
US10856040B2 (en) * 2017-10-31 2020-12-01 Avago Technologies International Sales Pte. Limited Video rendering system
CN111434114B (en) * 2017-12-01 2024-06-11 交互数字Vc控股公司 Processing images
EP3496028A1 (en) * 2017-12-08 2019-06-12 Koninklijke Philips N.V. Improved high dynamic range video color remapping
CN109982007B (en) * 2017-12-27 2021-11-19 联发科技股份有限公司 Format conversion circuit applied to set top box and related method
JP7246855B2 (en) 2018-02-16 2023-03-28 キヤノン株式会社 Imaging device, recording device and display control device
EP3761637B1 (en) * 2018-03-02 2023-06-28 Sony Group Corporation Video-signal-processing device, video-signal-processing method, and imaging device
US10445865B1 (en) * 2018-03-27 2019-10-15 Tfi Digital Media Limited Method and apparatus for converting low dynamic range video to high dynamic range video
CN108492772B (en) * 2018-03-30 2019-10-25 京东方科技集团股份有限公司 A kind of Gamma adjusting method and Gamma regulating system
CN108882028B (en) * 2018-07-05 2019-06-14 华为技术有限公司 The processing method and processing device of vision signal
CN108900823B (en) 2018-07-05 2019-07-12 华为技术有限公司 A kind of method and device of video frequency signal processing
EP3824633A1 (en) * 2018-07-20 2021-05-26 InterDigital VC Holdings, Inc. Method and apparatus for processing a medium dynamic range video signal in sl-hdr2 format
US20200192548A1 (en) * 2018-12-13 2020-06-18 Ati Technologies Ulc Methods and apparatus for displaying a cursor on a high dynamic range display device
EP3764346A1 (en) * 2019-07-09 2021-01-13 Koninklijke Philips N.V. Adjustment of display optimization behaviour for hdr images
CN112686809A (en) * 2019-10-18 2021-04-20 华为技术有限公司 Method and apparatus for processing high dynamic range images
EP3873096A1 (en) * 2020-02-25 2021-09-01 Koninklijke Philips N.V. Improved hdr color processing for saturated colors
US11330196B2 (en) * 2020-10-12 2022-05-10 Microsoft Technology Licensing, Llc Estimating illumination in an environment based on an image of a reference object
CN114842807B (en) * 2021-02-01 2023-11-17 广州视睿电子科技有限公司 Brightness adjustment method, system, device and storage medium
EP4415343A1 (en) 2023-02-08 2024-08-14 Koninklijke Philips N.V. Hdr out of gamut adjusted tone mapping

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6285798B1 (en) * 1998-07-06 2001-09-04 Eastman Kodak Company Automatic tone adjustment by contrast gain-control on edges
JP4245699B2 (en) * 1998-09-16 2009-03-25 オリンパス株式会社 Imaging device
JP5026092B2 (en) * 2007-01-12 2012-09-12 三菱電機株式会社 Moving picture decoding apparatus and moving picture decoding method
JP4894595B2 (en) * 2007-04-13 2012-03-14 ソニー株式会社 Image processing apparatus and method, and program
JP4902556B2 (en) * 2008-01-15 2012-03-21 キヤノン株式会社 Image processing apparatus, image processing method, program, and computer-readable storage medium
US8605083B2 (en) * 2009-03-06 2013-12-10 Koninklijke Philips N.V. Method for converting input image data into output image data, image conversion unit for converting input image data into output image data, image processing apparatus, display device
EP2406959B1 (en) * 2009-03-13 2015-01-14 Dolby Laboratories Licensing Corporation Layered compression of high dynamic range, visual dynamic range, and wide color gamut video
EP2445214A1 (en) * 2010-10-19 2012-04-25 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Video coding using temporally coherent dynamic range mapping
RU2643663C2 (en) 2012-03-26 2018-02-02 Конинклейке Филипс Н.В. Devices and methods for coding and decoding images with hdr based on brightness areas
AR091515A1 (en) 2012-06-29 2015-02-11 Sony Corp DEVICE AND METHOD FOR IMAGE PROCESSING
BR112014027815B1 (en) 2012-10-08 2022-03-15 Koninklijke Philips N.V. Image color processing apparatus, image encoder, image decoder and image color processing method
US9412155B2 (en) * 2012-12-31 2016-08-09 Karl Storz Imaging, Inc. Video system with dynamic contrast and detail enhancement
MX350910B (en) 2013-02-21 2017-09-25 Koninklijke Philips Nv Improved hdr image encoding and decoding methods and devices.
RU2657473C2 (en) 2013-04-30 2018-06-14 Сони Корпорейшн Transmission device, transmission method, reception device and reception method

Also Published As

Publication number Publication date
WO2017102606A1 (en) 2017-06-22
PL3235236T3 (en) 2018-11-30
ES2684432T3 (en) 2018-10-02
EP3235236A1 (en) 2017-10-25
RU2017126189A (en) 2019-01-21
MX2017009282A (en) 2017-10-11
EP3235236B1 (en) 2018-06-20
US10152777B2 (en) 2018-12-11
US20180276801A1 (en) 2018-09-27
CN107211079B (en) 2021-05-28
HUE040383T2 (en) 2019-03-28
CN107211079A (en) 2017-09-26
ZA201704982B (en) 2019-01-30
BR112017016037A2 (en) 2018-03-20
JP2019504548A (en) 2019-02-14
RU2720446C2 (en) 2020-04-29
RU2017126189A3 (en) 2020-02-28
MX364488B (en) 2019-04-29

Similar Documents

Publication Publication Date Title
JP6495552B2 (en) Dynamic range coding for images and video
JP7343629B2 (en) Method and apparatus for encoding HDR images
JP6596125B2 (en) Method and apparatus for creating a code mapping function for encoding of HDR images, and method and apparatus for use of such encoded images
US10902567B2 (en) Handling multiple HDR image sources
JP7061073B6 (en) HDR video coding and decoding
JP6619888B2 (en) HDR video encoding and decoding
JP2019502221A (en) High dynamic range image optimization for specific displays
US11151962B2 (en) Graphics-safe HDR image luminance re-grading
WO2016119979A1 (en) Simple but versatile dynamic range coding
JP6831389B2 (en) Processing of multiple HDR image sources
US11741873B2 (en) Adjustment of display optimization behaviour for HDR images
JP7300070B2 (en) Improved HDR color handling for saturated colors
CN117296076A (en) Display optimized HDR video contrast adaptation
KR102279842B1 (en) Methods and apparatuses for encoding hdr images
KR20240116489A (en) Optimization of display of HDR images
CN117321625A (en) Display optimized HDR video contrast adaptation
BR112017002313B1 (en) ENCODER FOR ENCODING A HIGH DYNAMIC RANGE INPUT VIDEO, METHOD FOR ENCODING A HIGH DYNAMIC RANGE INPUT VIDEO, VIDEO DECODER FOR DECODING A HIGH DYNAMIC RANGE VIDEO, VIDEO DECODER FOR DECODING A SET OF IMAGES HIGH-RANGE VIDEO DYNAMIC AND VIDEO DECODING METHOD FROM A SET OF HIGH DYNAMIC RANGE VIDEO IMAGES

Legal Events

Date Code Title Description
A975 Report on accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A971005

Effective date: 20181116

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20181127

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190110

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20190205

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20190306

R150 Certificate of patent or registration of utility model

Ref document number: 6495552

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250