JP2023537939A - ハイダイナミックレンジビデオ用のピクチャメタデータ - Google Patents

ハイダイナミックレンジビデオ用のピクチャメタデータ Download PDF

Info

Publication number
JP2023537939A
JP2023537939A JP2023509433A JP2023509433A JP2023537939A JP 2023537939 A JP2023537939 A JP 2023537939A JP 2023509433 A JP2023509433 A JP 2023509433A JP 2023509433 A JP2023509433 A JP 2023509433A JP 2023537939 A JP2023537939 A JP 2023537939A
Authority
JP
Japan
Prior art keywords
image
metadata
display
input image
dynamic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2023509433A
Other languages
English (en)
Inventor
アトキンズ,ロビン
Original Assignee
ドルビー ラボラトリーズ ライセンシング コーポレイション
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ドルビー ラボラトリーズ ライセンシング コーポレイション filed Critical ドルビー ラボラトリーズ ライセンシング コーポレイション
Publication of JP2023537939A publication Critical patent/JP2023537939A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/70Circuitry for compensating brightness variation in the scene
    • H04N23/741Circuitry for compensating brightness variation in the scene by increasing the dynamic range of the image compared to the dynamic range of the electronic image sensors
    • GPHYSICS
    • G09EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
    • G09GARRANGEMENTS OR CIRCUITS FOR CONTROL OF INDICATING DEVICES USING STATIC MEANS TO PRESENT VARIABLE INFORMATION
    • G09G5/00Control arrangements or circuits for visual indicators common to cathode-ray tube indicators and other visual indicators
    • G09G5/10Intensity circuits
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/60Extraction of image or video features relating to illumination properties, e.g. using a reflectance or lighting model
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/74Image or video pattern matching; Proximity measures in feature spaces
    • G06V10/75Organisation of the matching processes, e.g. simultaneous or sequential comparisons of image or video features; Coarse-fine approaches, e.g. multi-scale approaches; using context analysis; Selection of dictionaries
    • G06V10/758Involving statistics of pixels or of feature values, e.g. histogram matching
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/74Image or video pattern matching; Proximity measures in feature spaces
    • G06V10/761Proximity, similarity or dissimilarity measures
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/46Colour picture communication systems
    • H04N1/56Processing of colour picture signals
    • H04N1/60Colour correction or control
    • H04N1/6058Reduction of colour to a range of reproducible colours, e.g. to ink- reproducible colour gamut
    • H04N1/6063Reduction of colour to a range of reproducible colours, e.g. to ink- reproducible colour gamut dependent on the contents of the image to be reproduced
    • H04N1/6066Reduction of colour to a range of reproducible colours, e.g. to ink- reproducible colour gamut dependent on the contents of the image to be reproduced dependent on the gamut of the image to be reproduced
    • GPHYSICS
    • G09EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
    • G09GARRANGEMENTS OR CIRCUITS FOR CONTROL OF INDICATING DEVICES USING STATIC MEANS TO PRESENT VARIABLE INFORMATION
    • G09G2320/00Control of display operating conditions
    • G09G2320/02Improving the quality of display appearance
    • G09G2320/0271Adjustment of the gradation levels within the range of the gradation scale, e.g. by redistribution or clipping
    • G09G2320/0276Adjustment of the gradation levels within the range of the gradation scale, e.g. by redistribution or clipping for the purpose of adaptation to the characteristics of a display device, i.e. gamma correction
    • GPHYSICS
    • G09EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
    • G09GARRANGEMENTS OR CIRCUITS FOR CONTROL OF INDICATING DEVICES USING STATIC MEANS TO PRESENT VARIABLE INFORMATION
    • G09G2340/00Aspects of display data processing
    • G09G2340/06Colour space transformation
    • GPHYSICS
    • G09EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
    • G09GARRANGEMENTS OR CIRCUITS FOR CONTROL OF INDICATING DEVICES USING STATIC MEANS TO PRESENT VARIABLE INFORMATION
    • G09G2360/00Aspects of the architecture of display systems
    • G09G2360/16Calculation or use of calculated indices related to luminance levels in display data

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Evolutionary Computation (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Computing Systems (AREA)
  • Databases & Information Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Signal Processing (AREA)
  • Computer Hardware Design (AREA)
  • Image Processing (AREA)
  • Television Systems (AREA)

Abstract

動的ピクチャメタデータを生成する方法及びシステムが提示される。マスタリングディスプレイ上で生成された入力画像と、マスタリングディスプレイとは異なるターゲットディスプレイの特性と、入力画像に関する動的メタデータの初期セットとを所与として、反復アルゴリズムが、ディスプレイ管理プロセス及びイメージメタデータに従って、入力画像をターゲットディスプレイ向けのマッピング画像へとマッピングし、視覚的外観一致指標に従って入力画像をマッピング画像と比較し、視覚的外観一致指標に従った入力画像とマッピング画像との間の可視性相違値が閾値を下回るまで、最適化技術を用いてイメージメタデータを更新する。

Description

この出願は、2020年8月17日に出願された米国仮出願第63/066,663号及び2020年8月17日に出願された欧州特許出願第20191269.8号に対する優先権を主張するものであり、これらの各々をその全体にてここに援用する。
本発明は概して画像に関する。より具体的には、本発明の一実施形態は、ビデオシーケンス及び静止画像に対して動的メタデータを生成することに関する。
ここで使用されるとき、用語‘ダイナミックレンジ’(DR)は、例えば最も暗い灰色(黒)から最も明るい白(ハイライト)まで、画像における強度(例えば、輝度、ルマ)の範囲を知覚する人間の視覚系(human visual system;HVS)の能力に関するとし得る。この意味で、DRは‘シーン参照’強度に関する。DRはまた、特定の幅の強度範囲を十分又は適切にレンダリングするディスプレイ装置の能力にも関し得る。この意味で、DRは‘ディスプレイ参照’強度に関する。ここでの記載のいずれかの時点において特定の意味を持つとして特定の意味が明示的に規定されない限り、この用語は、例えば交換可能に、いずれの意味でも使用され得ると推測されるべきである。
ここで使用されるとき、ハイダイナミックレンジという用語は、人間の視覚系(HVS)の14-15桁の大きさに及ぶDR幅に関係する。実際には、人間がその強度範囲内の広い範囲を同時に知覚できるDRは、HDRに対して幾分切り捨てられてしまい得る。ここで使用されるとき、ビジュアルダイナミックレンジ(VDR)又はエンハンストダイナミックレンジ(EDR)という用語は、個別に、あるいは交換可能に、目の動きを含んでシーン又は画像にわたっての光順応変化を可能にする人間の視覚系(HVS)によってシーン又は画像内で知覚可能なDRに関し得る。ここで使用されるとき、VDRは、5-6桁の大きさのDRに関係し得る。従って、HDRとされる真のシーンに対して幾分狭くなり得るが、VDR又はEDRはそれでも広いDR幅を表し、HDRとも称され得る。
実際には、画像は1つ以上の色成分(例えば、ルマYとクロマCb及びCr)を有し、各色成分が、ピクセル当たりnビットの精度(例えば、n=8)で表される。例えば、ガンマルミナンスコーディングを用いると、n≦8の画像(例えば、カラーの24ビットJPEG画像)はスタンダードダイナミックレンジの画像とみなされ、n≧10の画像はエンハンストダイナミックレンジの画像とみなされ得る。HDR画像はまた、例えばIndustrial Light and Magicによって開発されたOpenEXRファイルフォーマットなどの、高精度(例:16ビット)浮動小数点フォーマットを用いて保存及び配布され得る。
大抵の消費者向けデスクトップディスプレイは、現在、200-300cd/m又はニットの輝度をサポートしている。大抵の消費者向けHDTVは300-500ニットの範囲に及び、新しいモデルは1,000ニット(cd/m)に達している。そのような従来ディスプレイは、このように、HDRとの関係でスタンダードダイナミックレンジ(SDR)とも呼ばれる、低めのダイナミックレンジ(LDR)を典型とする。キャプチャ機器(例えば、カメラ)とHDRディスプレイ(例えば、ドルビーラボラトリーズ社からのPRM-4200プロフェッショナルリファレンスモニタ)との両方の進歩により、HDRコンテンツの利用可能性が増大するにつれて、HDRコンテンツは、カラーグレード化され、より高いダイナミックレンジ(例えば、1,000ニットから5,000ニット以上)をサポートするHDRディスプレイ上に表示されることになり得る。
ここで使用されるとき、用語“メタデータ”は、コーディングされたビットストリーム又はシーケンスの一部として伝送される補助情報に関係し、デコーダが復号した画像をレンダリングするのを支援する。そのようなメタデータは、以下に限られないが、ここに記載されるもののような、色空間又は色域情報、リファレンスディスプレイパラメータ、及び補助信号パラメータを含み得る。メタデータは、“静的”又は“動的”として特徴付けられることができる。静的メタデータの例は、例えばビデオコンテンツをマスタリングする際に使用されるディスプレイの原色、ホワイトポイント、及び輝度範囲などの、マスタリングディスプレイに関係するパラメータを含む(参考文献[1])。動的メタデータの例は、デコーダがターゲットディスプレイ上にビットストリームを表示するために使用する、ピクチャフレームの最小、平均、最大の輝度若しくはRGB値、トリムパスデータ、トーンマッピングパラメータを含む(参考文献[2])。ここで発明者によって認識されたように、既存及び将来の表示スキームを改善するためには、ビデオシーケンスに対して、特に、限定ではないが、HDRビデオに対して、ピクチャメタデータを生成するための改善された技術が必要である。
このセクションに記載されたアプローチは、先に進められ得るアプローチであり、必ずしもこれまでに考案又は追求されたアプローチではない。従って、別段の断りがない限り、このセクションに記載されたアプローチのいずれも、それらがこのセクションに含まれていることのみを理由にして従来技術をなすと想定されるべきでない。同様に、1以上のアプローチに関して特定された問題は、別段の断りがない限り、このセクションに基づいて、何らかの従来技術において認識されていたと想定されるべきでない。
同様の要素は似通った参照符号で指す添付図面の図に、限定としてではなく例として本発明の一実施形態を示す。
ビデオ配信パイプラインのプロセス例を示している。 本発明の一実施形態に従った動的ピクチャメタデータを生成するためのプロセスフロー例を示している。
動的ピクチャメタデータを生成する方法及びシステムが記述される。以下の説明では、説明の目的で、本発明の完全なる理解を提供するために数多くの具体的詳細が説明される。しかし、明らかなことには、本発明はそれらの具体的詳細を用いずに実施されてもよい。また、本発明をいたずらに塞いだり不明瞭にしたり難読化したりしないために、周知の構造や装置を徹底的な詳細さで説明することはしない。
概要
ここに記載される実施形態例は、動的メタデータを生成する方法及びシステムに関する。プロセッサが、マスタリングディスプレイ上でマスタリングされた第1ダイナミックレンジ(例えば、HDR又はSDR)のビデオピクチャのシーケンスと、初期ダイナミックイメージメタデータとを受信し、ピクチャメタデータは、マスタリングディスプレイとは異なり得るターゲットディスプレイ上にビデオピクチャを表示することを可能にするためのシンタックスパラメータを有する。
プロセッサは、
a)ディスプレイマッピングプロセスを適用して、入力画像を、第2ダイナミックレンジのマッピング画像へとマッピングし、ディスプレイマッピングプロセスは、動的イメージメタデータ、及びターゲットディスプレイのディスプレイ特性を考慮に入れるものであり、
b)外観一致指標(appearance matching metric)を用いて入力画像とマッピング画像とを比較して、可視性相違値(visibility difference value)を生成し、
可視性相違値が閾値より大きい場合には、
c)動的イメージメタデータにメタデータ最適化方法を適用することで、可視性相違値を減らし、更新イメージメタデータを生成し、
d)動的イメージメタデータを更新イメージメタデータで置換し、
終了基準まで、別のメタデータ更新反復のためにステップaに戻り、
そうでない場合には、入力画像と動的イメージメタデータとを有する出力を生成する。
ハイダイナミックレンジビデオ向けのメタデータ
信号のビデオコーディング
図1は、 図1Aは、映像キャプチャから映像コンテンツ表示までの様々な段階を示す、映像配信パイプライン(100)のプロセス例を示している。画像生成ブロック(105)を用いて、映像フレーム(102)のシーケンスがキャプチャ又は生成される。映像フレーム(102)は、(例えば、デジタルカメラによって)デジタル的にキャプチャされて、あるいは(例えば、コンピュータアニメーションを用いて)コンピュータによって生成されて、映像データ(107)を提供し得る。あるいは、映像フレーム(102)は、フィルムカメラによってフィルム上にキャプチャされてもよい。フィルムがデジタルフォーマットに変換されて、映像データ(107)を提供する。制作フェーズ(110)にて、映像データ(107)が編集されて、映像制作ストリーム(112)を提供する。
次いで、制作ストリーム(112)の映像データが、制作後の編集のために、ブロック(115)にてプロセッサに提供される。ブロック(115)の制作後編集は、映像制作者の創作意図に従って画像の質を高めたり特定の見た目の画像を達成したりするために、映像の特定の領域内の色又は輝度を調整又は修正することを含み得る。これは、“カラータイミング”又は“カラーグレーディング”と呼ばれることもある。これはまた、フレーム/ピクチャレートリサンプリングを含み得る。他の編集(例えば、シーン選択及びシーケンス化、画像クロッピング、コンピュータ生成した視覚的特殊効果の付加、可変フレームレートシーケンシングなど)をブロック(115)で実行してもよく、配信のための最終版の制作物(117)を産み出すことができる。制作後編集(115)の間、リファレンス又はマスタリングディスプレイ(125)上でビデオ画像が眺められる。
ポスト制作(115)に続いて、最終制作物(117)の映像データが、例えばテレビジョンセット、セットトップボックス、映画館などの復号再生装置へのダウンストリーム配信のために、符号化ブロック(120)に送達され得る。一部の実施形態において、符号化ブロック(120)は、符号化ビットストリーム(122)を生成するために、例えばATSC、DVB、DVD、Blu-Ray(登録商標)、及び他の配信フォーマットによって定義されるものなどの、オーディオビデオエンコーダを含み得る。受信器にて、符号化ビットストリーム(122)が復号ユニット(130)によって復号されて、信号(117)と同一もの又はそれをよく近似したものを表す復号信号(132)を生成する。受信器は、リファレンスディスプレイ(125)とは全く異なる特性を持ち得るターゲットディスプレイ(140)に取り付けられることがある。その場合、ディスプレイ管理ブロック(135)を使用して、ディスプレイマッピングされた信号(137)を生成することによって、復号信号(132)のダイナミックレンジ又はフレームレートをターゲットディスプレイ(140)の特性にマッピングし得る。
エコシステム100を所与として、画像処理パイプラインの様々な段階、特にディスプレイ管理プロセス(135)における信号処理をガイドするために、ピクチャメタデータが含められる。例えば、参考文献[2]に記載されるように、限定ではないが、Dolby Visionハイダイナミックレンジパイプラインの用語を用いるに、ピクチャメタデータは以下のパラメータのうちの1つ以上を含み得る。
L1メタデータであり、これは、ソースビデオデータ122の1つ以上のシーンを表す最小(“crush”)、中間調(“mid”)、及び最大(”clip”)の輝度又はRGB値をそれぞれ表すmin、mid、及びmaxのような量を含み得る。
L2メタデータであり、これは、基準ダイナミックレンジを持つリファレンスディスプレイ125を備えた制作スタジオで、ディレクター、カラーグレーダー、ビデオ専門家などに由来するビデオ特性調整に関する情報を提供及び/又は記述する。
L3メタデータであり、これは、リファレンスディスプレイ125の基準ダイナミックレンジとは異なる第2の基準ダイナミックレンジを持つ例えばターゲットディスプレイ140などの第2のリファレンスディスプレイを備えた制作スタジオで、ディレクター、カラーグレーダー、ビデオ専門家などに由来するビデオ特性調整に関する情報を提供及び/又は記述する。L3メタデータは、例えば、それぞれ(L1)量min、mid、及びmaxからのオフセットであるΔmin、Δmid、及びΔmaxなどの、L1メタデータからのオフセット又は調整を含み得る。
L4メタデータであり、これは、グローバルな調光処理に関する情報を提供又は記述する。L4メタデータは、前処理中にエンコーダによって計算され得るとともに、RGB原色を用いて計算され得る。一例において、L4メタデータには、毎フレームベースでディスプレイパネルのグローバルなバックライト輝度レベルを指示するデータが含み得る。
例えばL11メタデータなどの、生成される他のメタデータが、例えば映画コンテンツ、コンピュータゲームコンテンツ、スポーツコンテンツ、及びこれらに類するものなどの、ビデオデータのソースを特定するために使用される情報を提供又は記述し得る。このようなメタデータは更に、例えば意図されたホワイトポイント、シャープネス、及びこれらに類するものなどの、意図されたピクチャ設定を提供又は記述し得る。
典型的に、このようなメタデータは、以下を含む多様な手法で生成される:
a. コンテンツに従ってプリセット値を手動で指定(例えば、:L11内の“ゲーム”)
b. 入力ビデオフレーム単位で解析し、画像の明るさ及び色の統計に基づいてメタデータを計算することによって自動で(例えば、LIのmin、mid、max値)
c. 例えば、1つ以上のモニタ上で結果を観察しながらメタデータ値(例えば、“トリムパス”L2メタデータ)を調整することによって、半手動又は半自動で。
デコーダによってコンテンツ132が受信されると、ターゲットディスプレイ140を所与として、ディスプレイ管理プロセス135によってコンテンツが処理され、それにより、ターゲットディスプレイ上での最適化されたレンダリングのために、到着したメタデータによって規定された画像特性を調整する。ディスプレイ管理プロセスの例は、参考文献[3-5]に見出すことができ、以下を含む多様な画像処理演算を含み得る:
・ 前処理及び後処理の色変換(例えば、YCbCr又はRGBからICtCpへ)
・ 画像スケーリング
・ トーンマッピング
・ 彩度制御
・ カラーボリュームマッピング
・ トリムパス制御、及び
・ 周辺光調整。
実施形態例は、ディスプレイレンダリングプロセスを改善するために、動的ピクチャメタデータの生成を改善する。ここに記述される実施形態は、主として、メタデータを生成するための自動化された方法に適用されるが、例えばトリムパスメタデータを調整するための、半手動又は半自動の方法にも適用可能であり得る。
図2は、一実施形態に従った動的ピクチャメタデータを生成するプロセス例(200)を示している。図2に示すように、入力画像又は画像シーケンス205を与えられて、ステップ210で、既知の手動、自動、又は半自動のメタデータ生成技術に基づいてメタデータの初期セットを生成する。次に、ステップ215にて、ターゲットディスプレイ、入力画像(205)、及び関連メタデータ(例えば、ステップ210からの初期メタデータ又はステップ235からの更新メタデータ(237))を所与として、好ましくは下流のデコーダによって使用されるものと同様のものであるディスプレイ管理プロセスを入力画像に適用することで、マッピングされた画像(マッピング画像)(217)を生成する。次に、ステップ220にて、適切な外観一致指標又は視覚的差異品質指標を用いてオリジナル画像(205)とマッピング画像(217)とを比較する。ここでの目的は、模擬した人間の観察者に従って、オリジナル画像とマッピング画像とが互いにどれだけ同等であるかをシミュレーションすることである。典型的に、指標によって返される誤差が小さいほど、予測される視覚的差異が小さく、より良く一致する。限定するものではないが、このような視覚的な品質指標の例は、VMAF(video multimethod assessment fusion metric)(参考文献[6])、SSIM(structural similarity index measure)(参考文献[7])、及びHDR-VDP(HDR-visual difference predictor)(参考文献[8])を含む。
比較されている2つの画像は、異なるカラーボリューム(例えば、ダイナミックレンジ及び色域)並びに異なる解像度若しくはフレームレートを持ち得るので、好適な画像品質指標は、これらの違いにかかわらず、これら2つの画像間の外観一致を予測できるべきである。
ステップ230にて、反復プロセスを終了する必要があるかの決定を行う必要がある。例えば、マッチングの差が特定の閾値より小さい場合、又は最大量の時間若しくは反復に達した場合に、このプロセスは終了し得る。終了決定が行われた場合には、最終的なメタデータが出力され(240)、そうでない場合には、ステップ235にて、更新されたメタデータ(更新メタデータ)(237)が生成され得る。
特定の画像品質指標を所与として、メタデータ更新ステップ(237)は、例えば勾配降下法、レーベンバーグ・マルカートアルゴリズム(Levenberg-Marquardt)アルゴリズム、及びこれらに類するものなどの、既知の最適化技術を用いて実装され得る。動的イメージメタデータにメタデータ最適化方法を適用して、可視性相違値を減らし、更新イメージメタデータを生成することが意味するのは、動的イメージメタデータが、低減された可視性相違値を持つ更新イメージメタデータで置換されるということである。可視性相違値を減らす更新メタデータを特定するのがメタデータ最適化方法である。可視性相違値は、外観一致指標を用いて入力画像とマッピング画像とを比較することによって生成される。
一実施形態において、一部のメタデータタイプ(例えばL2など)について、多様なターゲットディスプレイに対して異なるメタデータが計算され得る。このようなシナリオでは、上述のプロセスを各ターゲットディスプレイに対して複製することができ、異なるディスプレイ環境をターゲットとするビットストリームは異なるメタデータセットを組み込み得る。
他の一実施形態において、マッピング画像(217)は更に、改善マッピング画像を生成するために、電力制限、グローバル調光、画像エンハンスメント、及びこれらに類するものを含むターゲットディスプレイの追加モデリング処理によって処理されることができ、入力画像との比較ステップ(ステップ220)において、マッピング画像(217)の代わりに該改善マッピング画像が使用され得る。このプロセスは、ディスプレイ管理プロセスの一部だけではないターゲットディスプレイの特定のディスプレイ処理を考慮に入れたメタデータをもたらす。
他の一実施形態において、生成されたマッピング画像(217)がディスプレイ装置(例えば、ターゲットディスプレイ)上にレンダリングされ得る。次いで、ディスプレイ装置上に示された画像が、較正されたデジタルカメラによってキャプチャされて、較正されたキャプチャ画像を生成することができ、そして、入力画像との比較ステップ(ステップ220)において、マッピング画像(217)の代わりに該較正されたキャプチャ画像が使用され得る。このプロセスは、さもなければディスプレイ管理プロセスだけでも改善マッピング画像でも模倣するのが非常に困難であり得るターゲットディスプレイの表示特性とリファレンスディスプレイとの間で外観を保持するように最適化されたメタデータをもたらす。
他の一実施形態において、出力は、ネットワーク上で、当該出力を生成することに使用されるプライマリシステムの外部のセカンダリシステムに伝送される。セカンダリシステムは、入力画像及び動的イメージメタデータを用いて画像がレンダリングされるディスプレイを有し得る。セカンダリシステムのディスプレイは、ターゲットディスプレイと比較して同じ又は異なるディスプレイ特性を持ち得る。入力画像と動的イメージメタデータとを出力として提供することの考え得る利点は、この出力を広範なディスプレイに送ることができることである。そして、デコーダは、実際のディスプレイに応じて、最適化されたメタデータを入力画像にどのように適用すべきかを決めることができる。
これらの参考文献の各々をその全体にてここに援用する。
参考文献
[1]“Mastering display color volume metadata supporting high luminance and wide color gamut images”,SMPTE ST 2086:2014,The Society of Motion Picture and Television Engineers,2014
[2]A.K.A.Choudhury,et al.,“Tone curve optimization method and associated video”,PCT Application,PCT/US2018/049585,filed on Sept.05,2018,published as WO2019/050972 (March 14,2019)
[3]R.Atkins,“Display management for high dynamic range video”,U.S. Patent 9,961,237
[4]J.A.Pytlarz,et al.,“Ambient light-adaptive display management”,U.S Patent Application Publication 2019/0304379,Oct. 3,2019
[5]R.Atkins,et al.,“Display management for high dynamic range images”,PCT Application PCT/US2020/028552,filed on April 16, 2020
[6]R.Rassool,“VMAF reproducibility: Validating a perceptual practical video quality metric”,2017 IEEE international symposium on broadband multimedia systems and broadcasting (BMSB),IEEE,2017
[7]Z.Wang,et al.,“Image quality assessment: from error visibility to structural similarity”,IEEE transactions on image processing 13.4 (2004): 600-612
[8]R.Mantiuk,et al.,“HDR-VDP-2: A calibrated visual metric for visibility and quality predictions in all luminance conditions”,ACM Transactions on graphics (TOG) 30.4 (2011): 1-14
コンピュータシステム実装例
本発明の実施形態は、コンピュータシステム、電子回路及びコンポーネントにて構成されたシステム、例えばマイクロコントローラ、フィールドプログラマブルゲートアレイ(FPGA)や他のコンフィギュラブル若しくはプログラマブルロジックデバイス(PLD)、離散時間若しくはデジタル信号プロセッサ(DSP)、特定用途向けIC(ASIC)などの集積回路(IC)デバイス、及び/又はそのようなシステム、デバイス若しくはコンポーネントのうちの1つ以上を含む装置で実装され得る。コンピュータ及び/又はICは、例えばここに記述されたものなどの動的ピクチャメタデータを生成することに関する命令を遂行、制御、又は実行することができる。コンピュータ及び/又はICは、ここに記述された動的ピクチャメタデータを生成することに関する多様なパラメータ又は値のうちのいずれかを計算することができる。画像及びビデオの実施形態は、ハードウェア、ソフトウェア、ファームウェア、及びこれらの様々な組み合わせで実装され得る。
本発明の特定の実装は、プロセッサに本発明の方法を実行させるソフトウェア命令を実行するコンピュータプロセッサを有する。例えば、ディスプレイ、エンコーダ、セットトップボックス、トランスコーダ、又はこれらに類するもの内の1つ以上のプロセッサが、当該プロセッサがアクセス可能なプログラムメモリ内のソフトウェア命令を実行することによって、上述の動的ピクチャメタデータを生成することに関する方法を実施し得る。本発明はまた、プログラムプロダクトの形態で提供されることもできる。当該プログラムプロダクトは、データプロセッサによって実行されるときに該データプロセッサに本発明の方法を実行させる命令を有するコンピュータ読み取り可能信号のセットを担持する有形で非一時的な媒体を有し得る。本発明に従ったプログラムプロダクトは、多種多様な形態のうちのいずれであってもよい。当該プログラムプロダクトは、例えば、フロッピーディスク(登録商標)、ハードディスクドライブを含む磁気データ記憶媒体、CD ROM、DVDを含む光データ記憶媒体、ROM、フラッシュRAMを含む電子データ記憶媒体、又はこれらに類するものなどの、物理的媒体を有し得る。当該プログラムプロダクト上のコンピュータ読み取り可能信号はオプションで圧縮又は暗号化され得る。
上でコンポーネント(例えば、ソフトウェアモジュール、プロセッサ、アセンブリ、デバイス、回路など)が言及される場合、別段の断りがない限り、そのコンポーネントへの言及(“手段”への言及を含む)は、そのコンポーネントに均等なものとして、本発明の例示された実施形態例における機能を実行する開示構造に構造的には等価でないコンポーネントを含め、記載されるコンポーネントの機能を実行する任意のコンポーネント(例えば、それは機能的に等価である)を含むものと解釈されるべきである。
均等、拡張、代替、及び寄せ集め
動的ピクチャメタデータを生成することに関する実施形態を斯く説明した。以上の明細書では、本発明の実施形態を、実装ごとに変わり得る数多くの具体的詳細を参照して説明している。従って、何が発明であるのか及び出願人によって何が発明であると意図されているのかを唯一排他的に示すものは、この出願に由来する請求項のセットであり、それら請求項が由来する具体的な形態において、その後の訂正を含む。それら請求項に含まれる用語についてここに明示的に記載された定義は、請求項に使用されるそれら用語の意味を支配する。従って、請求項に明示的に記載されていない制限、要素、特性、特徴、利点又は属性は、請求項の範囲を如何様にも限定すべきでない。従って、明細書及び図面は、限定的な意味ではなく例示的な意味で見られるべきである。
本発明の様々な態様が、以下の列挙実施形態例(enumerated example embodiment;EEE)から理解され得る:
1. プロセッサで動的ピクチャメタデータを生成する方法であって、
第1ダイナミックレンジの入力画像と動的イメージメタデータとを受信し、前記入力画像はマスタリングディスプレイ上でマスタリングされており、
a)ディスプレイマッピングプロセスを適用して、前記入力画像を、第2ダイナミックレンジのマッピング画像へとマッピングし、前記ディスプレイマッピングプロセスは、前記動的イメージメタデータ、及び前記マスタリングディスプレイとは異なるターゲットディスプレイのディスプレイ特性を考慮に入れるものであり、
b)外観一致指標を用いて前記入力画像と前記マッピング画像とを比較して、可視性相違値を生成し、
前記可視性相違値が閾値より大きい場合には、
c)前記動的イメージメタデータにメタデータ最適化方法を適用することで、前記可視性相違値を減らし、更新イメージメタデータを生成し、
d)前記動的イメージメタデータを前記更新イメージメタデータで置換し、
終了基準まで、別のメタデータ更新反復のためにステップaに戻り、
そうでない場合には、前記入力画像と前記動的イメージメタデータとを有する出力を生成する、
ことを有する方法。
2. 前記第1ダイナミックレンジはハイダイナミックレンジであり、前記第2ダイナミックレンジはスタンダードダイナミックレンジである、EEE1の方法。
3. 前記終了基準は、メタデータ更新反復の総回数を最大反復回数より少なく制限することを含む、EEE1又は2の方法。
4. 前記外観一致指標は、VMAF(video multimethod assessment fusion metric)、SSIM(structural similarity index measure)、及びHDR-VDP(HDR-visual difference predictor)のうちの1つを有する、EEE1乃至3のいずれか一の方法。
5. 前記メタデータ最適化方法は、勾配降下法又はレーベンバーグ・マルカートアルゴリズムの一方を有する、EEE1乃至4のいずれか一の方法。
6. 前記入力画像に関する前記動的イメージメタデータは、前記入力画像のピクセル値の統計に基づくメタデータパラメータを有する、EEE1乃至5のいずれか一の方法。
7. 前記入力画像に関する前記動的イメージメタデータは、前記ターゲットディスプレイ上で前記入力画像を観察している間に計算された、調整されたメタデータパラメータを有する、EEE1乃至5のいずれか一の方法。
8. ステップaの後に、前記マッピング画像に、前記ターゲットディスプレイに関する追加モデリング処理を適用して、改善マッピング画像を生成し、
ステップbにて、前記外観一致指標を用いて前記入力画像と前記改善マッピング画像とを比較して、前記可視性相違値を生成する、
ことを更に有するEEE1乃至7のいずれか一の方法。
9. 前記追加モデリング処理は、前記ターゲットディスプレイに関する電力制限、グローバル調光、又は画像エンハンスメント処理を有する、EEE8の方法。
10. ステップaの後に、前記マッピング画像を前記ターゲットディスプレイにレンダリングして、レンダリング画像を生成するとともに、該レンダリング画像をカメラでキャプチャして、キャプチャ画像を生成し、
ステップbにて、前記外観一致指標を用いて前記入力画像と前記キャプチャ画像とを比較して、前記可視性相違値を生成する、
ことを更に有するEEE1乃至7のいずれか一の方法。
11. プロセッサを有し、EEE1乃至10のいずれか一の方法を実行するように構成された装置。
12. EEE1乃至10のいずれか一の方法を1つ以上のプロセッサで実行するためのコンピュータ実行可能命令を格納した非一時的コンピュータ読み取り可能記憶媒体。

Claims (15)

  1. プロセッサで動的ピクチャメタデータを生成する方法であって、
    第1ダイナミックレンジの入力画像と動的イメージメタデータとを受信し、前記入力画像はマスタリングディスプレイ上でマスタリングされており、
    a)ディスプレイマッピングプロセスを適用して、前記入力画像を、第2ダイナミックレンジのマッピング画像へとマッピングし、前記ディスプレイマッピングプロセスは、前記動的イメージメタデータ、及び前記マスタリングディスプレイとは異なるターゲットディスプレイのディスプレイ特性を考慮に入れるものであり、
    b)外観一致指標を用いて前記入力画像と前記マッピング画像とを比較して、可視性相違値を生成し、
    前記可視性相違値が閾値より大きい場合には、
    c)前記動的イメージメタデータにメタデータ最適化方法を適用することで、前記可視性相違値を減らし、更新イメージメタデータを生成し、
    d)前記動的イメージメタデータを前記更新イメージメタデータで置換し、
    終了基準まで、別のメタデータ更新反復のためにステップaに戻り、
    そうでない場合には、前記入力画像と前記動的イメージメタデータとを有する出力を生成する、
    ことを有する方法。
  2. 前記出力は、ネットワーク上で、前記出力を生成することに使用されるプライマリシステムの外部のセカンダリシステムに伝送される、請求項1に記載の方法。
  3. 前記セカンダリシステムが、前記入力画像及び前記動的イメージメタデータを用いて画像がレンダリングされるディスプレイを含む、請求項2に記載の方法。
  4. 前記セカンダリシステムの前記ディスプレイは、前記ターゲットディスプレイと比較して同じ又は異なるディスプレイ特性を持つ、請求項3に記載の方法。
  5. 前記第1ダイナミックレンジはハイダイナミックレンジであり、前記第2ダイナミックレンジはスタンダードダイナミックレンジである、請求項1乃至4のいずれか一項に記載の方法。
  6. 前記終了基準は、メタデータ更新反復の総回数を最大反復回数より少なく制限することを含む、請求項1乃至5のいずれか一項に記載の方法。
  7. 前記外観一致指標は、VMAF(video multimethod assessment fusion metric)、SSIM(structural similarity index measure)、及びHDR-VDP(HDR-visual difference predictor)のうちの1つを有する、請求項1乃至6のいずれか一項の方法。
  8. 前記メタデータ最適化方法は、勾配降下法又はレーベンバーグ・マルカートアルゴリズムの一方を有する、請求項1乃至7のいずれか一項に記載の方法。
  9. 前記入力画像に関する前記動的イメージメタデータは、前記入力画像のピクセル値の統計に基づくメタデータパラメータを有する、請求項1乃至8のいずれか一項に記載の方法。
  10. 前記入力画像に関する前記動的イメージメタデータは、前記ターゲットディスプレイ上で前記入力画像を観察している間に計算された、調整されたメタデータパラメータを有する、請求項1乃至8のいずれか一項に記載の方法。
  11. ステップaの後に、前記マッピング画像に、前記ターゲットディスプレイに関する追加モデリング処理を適用して、改善マッピング画像を生成し、
    ステップbにて、前記外観一致指標を用いて前記入力画像と前記改善マッピング画像とを比較して、前記可視性相違値を生成する、
    ことを更に有する請求項1乃至10のいずれか一項に記載の方法。
  12. 前記追加モデリング処理は、前記ターゲットディスプレイに関する電力制限、グローバル調光、又は画像エンハンスメント処理を有する、請求項11に記載の方法。
  13. ステップaの後に、前記マッピング画像を前記ターゲットディスプレイにレンダリングして、レンダリング画像を生成するとともに、該レンダリング画像をカメラでキャプチャして、キャプチャ画像を生成し、
    ステップbにて、前記外観一致指標を用いて前記入力画像と前記キャプチャ画像とを比較して、前記可視性相違値を生成する、
    ことを更に有する請求項1乃至10のいずれか一項に記載の方法。
  14. プロセッサを有し、請求項1乃至13のいずれか一項に記載の方法を実行するように構成された装置。
  15. 請求項1乃至13のいずれか一項に記載の方法を1つ以上のプロセッサで実行するためのコンピュータ実行可能命令を格納した非一時的コンピュータ読み取り可能記憶媒体。
JP2023509433A 2020-08-17 2021-08-05 ハイダイナミックレンジビデオ用のピクチャメタデータ Pending JP2023537939A (ja)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US202063066663P 2020-08-17 2020-08-17
EP20191269 2020-08-17
US63/066,663 2020-08-17
EP20191269.8 2020-08-17
PCT/US2021/044580 WO2022039930A1 (en) 2020-08-17 2021-08-05 Picture metadata for high dynamic range video

Publications (1)

Publication Number Publication Date
JP2023537939A true JP2023537939A (ja) 2023-09-06

Family

ID=77431433

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2023509433A Pending JP2023537939A (ja) 2020-08-17 2021-08-05 ハイダイナミックレンジビデオ用のピクチャメタデータ

Country Status (5)

Country Link
US (1) US11792532B2 (ja)
EP (1) EP4197190A1 (ja)
JP (1) JP2023537939A (ja)
CN (1) CN115918061A (ja)
WO (1) WO2022039930A1 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2024107472A1 (en) * 2022-11-16 2024-05-23 Dolby Laboratories Licensing Corporation Estimating metadata for images having absent metadata or unusable form of metadata

Family Cites Families (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5874988A (en) * 1996-07-08 1999-02-23 Da Vinci Systems, Inc. System and methods for automated color correction
US8330768B2 (en) * 2007-07-27 2012-12-11 Sharp Laboratories Of America, Inc. Apparatus and method for rendering high dynamic range images for standard dynamic range display
US8760578B2 (en) * 2010-04-19 2014-06-24 Dolby Laboratories Licensing Corporation Quality assessment of high dynamic range, visual dynamic range and wide color gamut image and video
EP2498499B1 (en) 2011-03-08 2018-04-18 Dolby Laboratories Licensing Corporation Interpolation of color gamut for display on target display
WO2012125892A1 (en) * 2011-03-17 2012-09-20 Dolby Laboratories Licensing Corporation Generating alternative versions of image content using histograms
EP2819414A3 (en) * 2013-06-28 2015-02-25 Samsung Electronics Co., Ltd Image processing device and image processing method
EP2989793B1 (en) 2013-11-13 2017-04-05 Dolby Laboratories Licensing Corporation Workflow for content creation and guided display management of enhanced dynamic range video
TR201815542T4 (tr) 2015-01-19 2018-11-21 Dolby Laboratories Licensing Corp Yüksek dinamik aralıklı videoya yönelik ekran yönetimi.
US10080026B2 (en) * 2015-03-20 2018-09-18 Dolby Laboratories Licensing Corporation Signal reshaping approximation
US10249263B2 (en) 2015-06-05 2019-04-02 Apple Inc. Rendering and displaying high dynamic range content
US10140953B2 (en) * 2015-10-22 2018-11-27 Dolby Laboratories Licensing Corporation Ambient-light-corrected display management for high dynamic range images
US10902567B2 (en) 2015-11-24 2021-01-26 Koninklijke Philips N.V. Handling multiple HDR image sources
EP3394850B1 (en) 2015-12-21 2020-05-13 Koninklijke Philips N.V. Optimizing high dynamic range images for particular displays
US9984446B2 (en) 2015-12-26 2018-05-29 Intel Corporation Video tone mapping for converting high dynamic range (HDR) content to standard dynamic range (SDR) content
CN109983530B (zh) 2016-12-22 2022-03-18 杜比实验室特许公司 环境光自适应显示管理
US11158032B2 (en) 2017-03-20 2021-10-26 Dolby Laboratories Licensing Corporation Perceptually preserving scene-referred contrasts and chromaticities
EP3451677A1 (en) 2017-09-05 2019-03-06 Koninklijke Philips N.V. Graphics-safe hdr image luminance re-grading
EP3679716A2 (en) * 2017-09-06 2020-07-15 Dolby Laboratories Licensing Corporation Tone-curve optimization method and associated video encoder and video decoder
KR102380164B1 (ko) 2018-09-19 2022-03-29 돌비 레버러토리즈 라이쎈싱 코오포레이션 게이밍 및/또는 sdr+ 콘텐츠에 대한 자동 디스플레이 관리 메타데이터 생성
CN113728624B (zh) 2019-04-23 2023-11-14 杜比实验室特许公司 高动态范围图像的显示管理

Also Published As

Publication number Publication date
US20230239579A1 (en) 2023-07-27
CN115918061A (zh) 2023-04-04
EP4197190A1 (en) 2023-06-21
US11792532B2 (en) 2023-10-17
WO2022039930A1 (en) 2022-02-24

Similar Documents

Publication Publication Date Title
US10062333B2 (en) Backlight control and display mapping for high dynamic range images
CN107409213B (zh) 用于高动态范围图像的内容自适应感知量化器
CN109155853B (zh) 用于高动态范围图像的色度整形
US10645403B2 (en) Chroma reshaping for high dynamic range images
JP7084984B2 (ja) トーンカーブ最適化方法および関連するビデオエンコーダとビデオデコーダ
JP6845946B2 (ja) ハイダイナミックレンジ画像のための映像処理曲線を調整するためのシステムおよび方法
CN110192223B (zh) 高动态范围图像的显示映射
CN110770787B (zh) 高效端到端单层逆向显示管理编码
KR102287095B1 (ko) 전력-제한 디스플레이 상에서의 하이 다이나믹 레인지 이미지를 위한 디스플레이 매핑
JP2023537939A (ja) ハイダイナミックレンジビデオ用のピクチャメタデータ
US11895416B2 (en) Electro-optical transfer function conversion and signal legalization
JP6470474B2 (ja) 補間誤差を抑えた低演算量ルックアップテーブル構築
RU2813229C1 (ru) Вычисление динамических метаданных для редактирования hdr контента
US20230230617A1 (en) Computing dynamic metadata for editing hdr content