JP7027554B2 - コンテンツスキャン適応メタデータを用いた光レベル管理 - Google Patents

コンテンツスキャン適応メタデータを用いた光レベル管理 Download PDF

Info

Publication number
JP7027554B2
JP7027554B2 JP2020537620A JP2020537620A JP7027554B2 JP 7027554 B2 JP7027554 B2 JP 7027554B2 JP 2020537620 A JP2020537620 A JP 2020537620A JP 2020537620 A JP2020537620 A JP 2020537620A JP 7027554 B2 JP7027554 B2 JP 7027554B2
Authority
JP
Japan
Prior art keywords
image
light level
content
frame
type
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2020537620A
Other languages
English (en)
Other versions
JP2021508990A (ja
Inventor
ショーン トーマス マッカーシー
Original Assignee
ドルビー ラボラトリーズ ライセンシング コーポレイション
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ドルビー ラボラトリーズ ライセンシング コーポレイション filed Critical ドルビー ラボラトリーズ ライセンシング コーポレイション
Publication of JP2021508990A publication Critical patent/JP2021508990A/ja
Application granted granted Critical
Publication of JP7027554B2 publication Critical patent/JP7027554B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/90Dynamic range modification of images or parts thereof
    • G06T5/92Dynamic range modification of images or parts thereof based on global image properties
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/50Image enhancement or restoration using two or more images, e.g. averaging or subtraction
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/90Dynamic range modification of images or parts thereof
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/90Determination of colour characteristics
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10016Video; Image sequence
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20172Image enhancement details
    • G06T2207/20208High dynamic range [HDR] image processing

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Description

関連出願の相互参照
本出願は、2018年1月11日に出願された米国仮特許仮出願第62/616,057号の優先権を主張するものであり、そのすべての内容が参照により本明細書に組み込まれている。
本発明は圧縮されたデジタルビデオの配信および表示に関し、より詳細にはハイダイナミックレンジ(HDR)および標準ダイナミックレンジ(SDR)圧縮ビデオのための改良された光レベル管理に関し、個々のフレームはプログレッシブフレーム、相補フィールドペア、およびフィールドおよびプログレッシブ領域の混合物の任意の組み合わせとして符号化される。
本明細書で使用されるように、「ダイナミックレンジ」(DR)という用語は、画像内の強度(例えば、輝度(luminance:ルミナンス)、輝度(luma:ルマ))の範囲、例えば、最も暗い黒(ダーク)から最も明るい白(ハイライト)までを知覚するための人間の視覚システム(HVS)の能力に関することができる。この意味で、DRは「シーン参照」強度に関する。DRはまた、特定の幅の強度範囲を適切にまたは近似的にレンダリングするための表示装置の能力に関することができる。この意味で、DRは「表示参照」強度に関する。本明細書の説明の任意の箇所で特定の意味を有するように明示的に指定されていない限り、この用語はいずれの意味でも、例えば、互換的に使用され得ると推察されるべきである。
本明細書で使用されるように、ハイダイナミックレンジまたはHDRという用語は、人間の視覚系(HVS)の約14~15桁またはそれ以上の大きさにまたがるDR幅に関する。実際には、人間が強度範囲の広い幅を同時に知覚することができるDRは、HDRに関していくらか切り捨てることができる。本明細書で使用されるように、拡張ダイナミックレンジ(EDR)または視覚ダイナミックレンジ(VDR)という用語は、眼球運動を含む人間の視覚システム(HVS)によってシーンまたは画像内で知覚可能なDRに個別にまたは互換的に関連し、シーンまたは画像全体にわたるいくつかの光適応変化を可能にすることができる。本明細書で使用されるように、EDRは、5桁から6桁にわたるDRに関連し得る。したがって、真のシーンに比べておそらくいくらか狭いが、EDRはそれにもかかわらず、広いDR幅を表し、HDRとも呼ばれ得る。
実際には、画像が色空間の1つまたは複数の色成分(例えば、ルマY、およびクロマCbおよびCr)を含み、ここで、各色成分はピクセルあたりnビットの精度(例えば、n=8)によって表される。線形輝度符号化を使用すると、n≦8の画像(例えば、カラー24ビットJPEG画像)は標準ダイナミックレンジの画像と考えられ、n>8の画像はエンハンスメントされたダイナミックレンジの画像と考えられる。
所与のディスプレイに対する基準電気光学伝達関数(EOTF)は、ディスプレイによって生成される出力スクリーン色値(例えば、スクリーン輝度)に対する入力ビデオ信号の色値(例えば、輝度)間の関係を特徴付ける。例えば、ITU Rec.ITU-R BT.1886「HDTVスタジオ制作で使用されるフラットパネルディスプレイのための参照電気光学伝達関数」(2011年3月)はその全体が参照により本明細書に組み込まれ、フラットパネルディスプレイのための参照EOTFを定義する。ビデオストリームのEOTFについての情報は一般に、メタデータとしてビットストリームに埋め込まれる。追加の説明は、ITU-R Rec.BT.2100-1「制作および国際番組交換で使用される高ダイナミックレンジテレビのための画像パラメータ値」(2017年6月)で見ることができ、これは、その全体が参照により本明細書に組み込まれる。本明細書で使用されるように、「メタデータ」という用語は、画像ビットストリームの一部として送信される任意の補助情報(例えば、符号化ビットストリーム、H.265ビットストリーム、H.264ビットストリーム、HDMI(登録商標)ビデオ信号など)に関連し、復号された画像をレンダリングするためにデコーダを支援する。そのようなメタデータは本明細書で説明するように、色空間または色域情報、基準表示パラメータ、および補助信号パラメータを含むことができるが、これらに限定されない。
200~1,000cd/mのルミナンスをサポートするディスプレイまたはユニットは、EDR(またはHDR)に関して、標準ダイナミックレンジまたはSDRとも呼ばれる、より低いダイナミックレンジ(LDR)を代表する。EDRコンテンツはよりハイダイナミックレンジ(例えば、1,000ニト(nits)から5,000ニト以上)をサポートするEDRディスプレイ上に表示されてもよい。そのような表示は、高輝度能力(例えば、0から10,000ニト)をサポートする代替EOTFを使用して定義され得る。このようなEOTFの一例は、SMPTE ST 2084:2014「high dynamic range EOTF of Mastering Reference Displays」(以下、「SMPTE」という)に定義されており、これは、その全体が参照により本明細書に組み込まれる。追加の説明はSMPTEで見つけることができ、「Study group report high dynamic range(HDR)imaging ecosystem」(2015)はその全体が参照により本明細書に組み込まれる。本発明者が認識するように、多種多様なSDRおよびHDR表示装置の可能な限り最高の表示能力を最適かつ効率的にサポートするために使用できるビデオデータを符号化および復号するための改良された技術が望まれる。
このセクションで説明されるアプローチは追求されることができるアプローチであるが、必ずしも、以前に考えられたまたは追求されたアプローチではない。したがって、特に断らない限り、このセクションに記載されているアプローチのいずれも、単にこのセクションに含まれているために先行技術として適格であると仮定すべきではない。同様に、1つまたは複数のアプローチに関して特定された問題は特に断らない限り、このセクションに基づいていかなる先行技術においても認識されていると推測すべきではない。
本発明の実施形態は限定ではなく例として、添付の図面の図に示されており、同様の参照番号は同様の要素を指す。
ビデオ配信パイプラインの例示的なプロセスを示す。 例示的な画像フレームを示す。 ピクセル(またはサンプル)のアレイを備える例示的な画像フレームを示す。 部分的にインターリーブされておらず部分的にインターリーブされた画像フレームタイプの画像フレームを示す。 例示的な符号化ビデオシーケンスを示す。 例示的な符号化ビデオシーケンスを示す。 画像フレームと、コンテンツ光レベルメタデータを含むがこれに限定されない対応する画像メタデータとを生成するための例示的なビデオエンコーダを示す。 画像フレームと、コンテンツ光レベルメタデータを含むがこれに限定されない対応する画像メタデータとを復号するための例示的なビデオデコーダを示す。 例示的なプロセスフローを示す。 例示的なプロセスフローを示す。 例示的なプロセスフローを示す。 例示的なプロセスフローを示す。 例示的なプロセスフローを示す。 例示的なプロセスフローを示す。 例示的なプロセスフローを示す。 例示的なプロセスフローを示す。 本明細書で説明されるコンピュータまたはコンピューティング装置が実装され得る例示的なハードウェアプラットフォームの簡略化されたブロック図を示す。
コンテンツ光レベル情報を用いてビデオデータを符号化および復号することが、本明細書で説明される。以下の説明において、説明の目的のために、本発明の完全な理解を提供するために、多数の特定の詳細が記載される。しかしながら、本発明は、これらの特定の詳細なしに実施されてもよいことは明らかであろう。他の例では、本発明を不必要に閉塞し、不明瞭にし、または難読化することを回避するために、周知の構造および装置は網羅的な詳細では説明されない。
概要
本明細書で説明される技法は、SDRおよびHDRビデオコンテンツが様々な輝度、リフレッシュレート、解像度、およびサイズ特性を有する固定ディスプレイおよびモバイルディスプレイ上の様々な視聴条件で消費されることを可能にするために、ビデオ生成、配信、および表示技術に適用され得る。
様々なビデオコンテンツの制作、配信、および表示オプションは、コンテンツの制作者、所有者、流通業者、消費者、および装置の製造業者がそれぞれ、ビデオ制作、配信、および消費者の経験における特定の効率的な利益を求めるため、非効率性の機会を作り出す。
コンテンツクリエータおよびディストリビュータは、個々の資産が特別な処理および取扱いなしに、広範囲の環境において、広範囲のディスプレイ上で消費され得る場合に、利益を得る。例えば、単一の圧縮ビデオ資産を、固定位置の屋内テレビディスプレイ、屋外デジタルディスプレイ、モバイルスマートフォン、タブレット、ラップトップ、および他のディスプレイに配信し、表示することができる場合に有益である。別の例として、単一の圧縮ビデオ資産を、任意のタイプのSDRディスプレイおよびHDRディスプレイの両方に配信し、表示することができる場合に有益である。本明細書で説明する技法は、圧縮ビットストリームで搬送され、ビデオコンテンツの表示を特定の表示および視聴環境特性に適合させるために使用される情報のためのシステムおよび方法に利用することができる。
消費者や装置製造業者は、ディスプレイの効率的な電力管理から利益を得る。電力管理は、バッテリ寿命が主要な関心事であるモバイル装置にとって特に重要であり得る。また、平均光量レベルがエネルギー消費量に影響する場合、HDRコンテンツの表示に電力管理が特に重要になる。本明細書で説明する技法は、圧縮ビットストリームで搬送され、ビデオ資産および表示装置の性質に基づいてエネルギー消費を管理するために使用される情報のためのシステムおよび方法に利用することができる。
コンテンツクリエータおよびオーナは芸術的意図の保存から恩恵を受け、これはマスタリングスタジオまたはライブプロダクションファシリティなどの参照視聴環境においてプロフェッショナルによって観察されるビデオコンテンツの知覚品質が、消費者によって観察されるビデオコンテンツの知覚品質を一貫して予測することを意味する。芸術的意図の保存は、専門的な基準ディスプレイとは著しく異なる(より明るいまたはより暗い)輝度特性を有する消費者ディスプレイにとって特に重要である。芸術的意図の保存はまた、専門的な参照観察環境とは著しく異なる周囲光レベルで観察される消費者ディスプレイにとっても重要である。本明細書で説明する技法は、圧縮ビットストリームで搬送され、広範囲のディスプレイおよび視聴環境にわたって芸術的意図を保存するために使用される情報のためのシステムおよび方法に利用することができる。
コンテンツクリエータ、オーナ、ディストリビュータ、消費者、および装置製造業者は、ビデオ標準が装置とサービスとの間の相互運用性を促進し、それによって、製造および流通におけるより多くの消費者の選択およびより優れた規模の経済性が促進される場合に利益を得る。本明細書で説明する技法の下で生成されるコンテンツ光レベル情報は、圧縮されたビットストリームで搬送することができ、表示管理に使用することができ、ビデオ規格と互換性がある。本明細書で使用されるように、コンテンツレベル情報内のコンテンツ光レベルは、1つまたは複数の画像フレーム、1つまたは複数の符号化ビデオシーケンス、プレイリスト内の1つまたは複数の番組などの、画像エリア全体の最大光レベル、平均光レベル、または最小光レベル、画像エリア全体の顕著な部分、視覚的に重要な画像エリアなどの集合光レベル(またはグループ光レベル)を指す。
コンテンツクリエータ、オーナ、ディストリビュータ、コンシューマ、および装置製造業者はまた、異なるビデオ圧縮規格が異なる能力を有する復号装置について同等のコンシューマ経験を提供する場合にも利益を得る。例えば、HEVCまたはAVC圧縮規格のいずれかを使用して、同等の芸術的意図、表示光レベル管理、および電力管理能力を提供することが有益である。コンテンツ作成者、所有者、配布者、消費者、および装置製造者は、圧縮されたビデオが1つのビデオ圧縮規格から別のビデオ圧縮規格にトランスコードされ、表示管理のために使用され得る情報を保存することができる場合にも利益を得る。例えば、HEVC圧縮ビデオをAVC圧縮ビデオにトランスコードして、AVC専用デコーダによって駆動されるディスプレイに同等の消費者ビデオ体験を届けることが有益である。本明細書で説明する技法は、HDMIなどの業界規格によって指定されたディジタルディスプレイインタフェースにわたって中継することができる、表示管理に使用される圧縮ビットストリーム内の情報を生成し、異なるビデオ規格機能を有する装置上の一貫したディスプレイ光レベル管理のためのビデオ規格間の相互運用性を可能にするシステムおよび方法に利用することができる。
したがって、本明細書で説明する技法のいくつかまたはすべてを、ビデオ制作、配信、および表示技術に適用して、必ずしもこれに限定されないが、上記で説明したものを含むいくつかの光レベル管理利点を配信することができる。
MaxCLLおよびMaxFALLなどのコンテンツ光レベルは、絶対輝度の単位(例えば、平方メートル当たりのカンデラまたはcd/mなど)で指定することができ、したがって、絶対輝度を表すビデオ符号値で符号化されたビデオコンテンツに容易に適用可能である。加えて、任意にまたは代替的に、絶対輝度値におけるコンテンツ光レベルは、ビデオコード値を絶対輝度として表示画像に関連付ける電気光学伝達関数(EOTF)、またはビデオコード値をピーク表示輝度に対する輝度に関連付ける他の工業標準のEOTFと共に使用することができる。したがって、例えば、MaxCLLおよびMaxFALLなどのコンテンツ光レベルは、SMPTE ST 2084によって指定された絶対輝度EOTFを使用して符号化されたHDRコンテンツ、またはHDTVスタジオ制作用ITU-R Rec.BT.1866ITU-R Recによって、およびHybrid-log Gamma(HLG)HDRテレビ制作用のITU-R Rec.BT.2100-1によって指定されるような相対輝度EOTFを使用して符号化されたコンテンツに適用され得る。
本明細書で説明する技法は、MaxCLLおよびMaxFALLを使用してプレイリスト内のビデオストリームの再生シーケンス全体の最大値を表すことができる動作シナリオ(例えば、ブルーレイディスクアソシエーションまたはBDAなどの下で)、ならびに、最大値が、プログラムが終了するまで利用可能であってもよいし、なくてもよい動作シナリオ(例えば、ライブ制作および配信など)に適用することができる。さらに、オプションまたは代替として、本明細書で説明する技法は、MaxCLLおよびMaxFALLなどのコンテンツ光レベルを、広告などの動的に挿入されたコンテンツを含むプログラミングに明確に適用することができる動作シナリオ(例えば、コンテンツ挿入、ディスプレイコンテンツに挿入または混合された異なるコンテンツ光レベルを有するコンテンツなど)に適用することができる。さらに、オプションまたは代替として、本明細書で説明する技法は、MaxCLLおよびMaxFALLなどのコンテンツ光レベルを、字幕などの動的にオーバーレイされたグラフィックスを含むプログラミングに明確に適用することができる動作シナリオ(例えば、オーバーレイされたグラフィックス、字幕、ディスプレイコンテンツに挿入または混合された異なるコンテンツ光レベルを有するグラフィックスなど)に適用することができる。
本明細書で説明されるコンテンツ光レベル情報は、多種多様なビデオ信号フォーマットまたはビットストリーム符号化シンタックスのビデオ信号で、上流の装置(例えば、ビデオエンコーダ、ビデオトランスコーダ、ビデオデコーダ、ブロードキャストサーバ、メディアストリーミングサービス、ビデオソース装置など)から、下流の装置(例えば、ビデオエンコーダ、ビデオトランスコーダ、ビデオデコーダ、ブロードキャストクライアント、メディアストリーミングクライアント、ビデオデスティネーション装置、表示装置、モバイルコンピュータなど)まで、配信され得る。いくつかの実施形態では、コンテンツ光レベル情報は、(例えば、TR-META-CM、CTA-861.3-A、高精細度マルチメディアインタフェース(HDMI)仕様、HEVC、AVC、H.264、H.265、BDA、Ultra HD、Blu-ray(登録商標)などの)ビデオ規格に準拠して符号化/書き込み/復号/読み出しが可能である。TR-META-CMの説明例としては、MovieLabsの「Common Metadata,TR-META-CM,v2.6」(2017年)を参照することができ、その全体が参照により本明細書に組み込まれる。H.265の説明例としては、「ITU-T H.265、High efficiency video coding」(12/2016年)を参照することができ、その全体が参照により本明細書に組み込まれる。Ultra HDの説明例としては、Ultra HD Forum「Phase Aガイドライン、Rev1.1(2016年)」を参照することができ、その全体が参照により本明細書に組み込まれる。Blu-rayの説明例としては、Blu-ray Disc Associationの「BD_ROM version3.0のためのBlu-ray Disc read-only format(Ultray HD Blu-ray)AV仕様」(2015年)を参照することができ、その全体が参照により本明細書に組み込まれる。
コンテンツ光レベル情報は、コンテンツ光レベル情報が受信装置によってどのように解釈されるべきかを指定するために、タイプおよび/または解釈情報とともに配信され得る。コンテンツ光レベル情報に対するタイプおよび/または解釈情報は、コンテンツ光レベル情報内の値が入力ビデオまたは復号された出力ビットストリームを表しているかどうかを明示することができ、したがって、出力フォーマットは、出力フォーマットとは異なることができる入力フォーマットの走査フォーマット(プログレッシブおよびインターレース)と区別することができる。これは、相補フィールドペアからなる入力フレームが、非インターリーブ画像フレーム(例えば、単一フィールドを有するフレームなど)のシーケンスとして、または各々が両方のフィールド(例えば、上部および下部など)を含む単一プログレッシブフレームとして符号化される動作シナリオにおいて有用である。出力ビットストリームのコンテンツ光レベル情報における値の計算は、符号化スキャンモードに依存し得る。これはまた、1つの明フィールドと1つの調光フィールドとを有する相補フィールドペアが両方のフィールドを含むフレームではなく個々のフィールド画像について計算された値である場合に、異なるコンテンツ光レベル情報値を生成し得る動作シナリオにおいても有用であり得る。そのような相補フィールドペアは、光のフラッシュ、白へのフェード、および黒へのフェードを表すビデオコンテンツに共通であり得る。そのようなビデオ相補フィールドペアは、テレシネされたフィールドペアとして符号化される、フィルム由来の毎秒24フレームのプログレッシブビデオフレームにも共通である。そのようなシナリオでは、1つのフレームからのフィールドが異なるフレームからのフィールドとペアにされることができ、したがって、入力と出力との間のコンテンツ光レベル情報値の差をもたらす。
コンテンツ光レベル情報のタイプおよび/または解釈情報を使用して、ライブ符号化およびトランスコーディングのためのコンテンツ光レベル情報内の値の解釈の曖昧さを解消することができる。これは、シーケンスが完全に符号化されるまで、CLVSのピクチャの公称ターゲット輝度光レベルのための上限の計算が完了しない可能性がある動作シナリオにおいて有用であり得る。したがって、本明細書で説明する技法の下でサポートされるユースケースは、ビデオオンデマンド、ファイルベースの符号化などだけでなく、スポーツ、ニュース、ライブエンターテイメント、オンザフライトランスコーディングなどのライブビデオ配信ユースケースもサポートする。
いくつかのビデオ信号は、符号化および/または復号のために利用可能なコーデックス走査モードの総数およびダイバーシティに関して、他のビデオ規格(例えば、AVC、個々のフィールドピクチャ、フレームピクチャ、および混合フィールドフレームピクチャまたはマクロブロック適応フィールドフレーム(MBAFF)などのうちの任意のもの)よりも制限的である(例えば、個々のフィールドまたはフレームなどのいずれか)ビデオ規格(例えば、HEVCなど)で符号化され得る。許容されるスキャンタイプおよびフレーム内およびシーケンス内のスキャンタイプのミキシングに関するAVCなどのビデオ規格におけるより大きな柔軟性は、コンテンツ光レベル情報内の値が入力と出力との間で異なることができるより多くの方法をもたらす。本明細書で説明する技法の下で生成されるようなコンテンツ光レベルおよびそれらのそれぞれのタイプを含むコンテンツ光レベルメタデータを使用して、AVC、HEVCなどを含むがこれらに限定されない多種多様なビデオ信号のコンテンツ光レベルの値を正しく解釈することができる。
本明細書で説明される例示的な実施形態は、ビデオデータを用いてコンテンツ光レベル情報を符号化することに関する。ソース画像のセットの中のソースピクセルからピクセルが生成される特定の画像フレームについて、特定の画像フレームの中の第1の画像フレーム部分と、特定の画像フレームの中の第2の画像フレーム部分とが決定される。特定の画像フレームは、表示装置によってフレームインターバルについてレンダリングされる。特定の画像フレーム内の第1の画像フレーム部分にインターリーブされるべき第1の画像フィールドおよび第2の画像フィールドは、ソース画像のセット内の第1の画像および第2の画像からそれぞれ生成される。第1の画像フィールドは、フレームインターバルの第1のフレームサブインターバルについてレンダリングされる。第2の画像フィールドは、フレームインターバルの第2のフレームサブインターバルについてレンダリングされる。フレームインターバルの第2のフレームサブインターバルは、フレームインターバルの第1のフレームサブインターバルに続く。特定の画像フレーム内の第2の画像フレーム部分内のすべてのピクセル位置を占有するために使用される第3の画像フィールドは、ソース画像のセット内の第3の画像から生成される。特定の画像フレームを含む複数の画像フレームで符号化される符号化ビデオシーケンスの1つまたは複数のコンテンツ光レベルは、特定の画像フレーム内の第1の画像フィールド、第2の画像フィールド、および第3の画像フィールドのピクセルに少なくとも部分的に基づいて生成される。符号化ビデオシーケンスは、1つまたは複数のコンテンツ光レベルを含むコンテンツ光レベルメタデータと共に、画像ビットストリームで送信される。
本明細書で説明される例示的な実施形態は、ビデオデータを用いてコンテンツ光レベル情報を復号することに関する。特定の画像フレームを含む複数の画像フレームで符号化された符号化ビデオシーケンスを含む画像ビットストリームは、複数の画像フレームおよび符号化ビデオシーケンスのための1つまたは複数のコンテンツ光レベルを含むコンテンツ光レベルメタデータに復号される。特定の画像フレームは、ソース画像のセット内のソースピクセルから生成されたピクセルを含み、フレームインターバルについてレンダリングされる。符号化ビデオシーケンスのための1つまたは複数のコンテンツ光レベルは、特定の画像フレーム内の第1の画像フィールド、第2の画像フィールド、および第3の画像フィールドのピクセルに少なくとも部分的に基づいて生成される。特定の画像フレーム内の第1の画像フレーム部分にインターリーブされる第1の画像フィールドおよび第2の画像フィールドは、ソース画像のセット内の第1の画像および第2の画像からそれぞれ生成される。第1の画像フィールドは、フレームインターバルの第1のフレームサブインターバルについてレンダリングされる。第2の画像フィールドは、フレームインターバルの第2のフレームサブインターバルについてレンダリングされる。フレームインターバルの第2のフレームサブインターバルは、フレームインターバルの第1のフレームサブインターバルに続く。特定の画像フレーム内の第2の画像フレーム部分内のすべてのピクセル位置を占有するために使用される第3の画像フィールドは、ソース画像のセット内の第3の画像から生成される。符号化ビデオシーケンスの1つまたは複数のコンテンツ光レベルに少なくとも部分的に基づいて、1つまたは複数の画像処理動作が、特定の画像フレームについて実行されて、ターゲット表示装置のために最適化された表示画像を生成する。最適化された表示画像は、ターゲット表示装置上にレンダリングされる。
本明細書で説明される例示的な実施形態は、ビデオデータを用いてコンテンツ光レベル情報を符号化することに関する。符号化ビデオシーケンスは、複数の画像フレームについて生成される。複数の画像フレーム内の各画像フレームは、複数のフレームインターバル内のそれぞれのフレームインターバルについて表示装置によってレンダリングされる。複数の画像フレーム内の各画像フレームは、完全にインターリーブされていない画像フレームタイプ、完全にインターリーブされた画像フレームタイプ、および部分的にインターリーブされておらず部分的にインターリーブされた画像フレームタイプなどを含む複数の画像フレームタイプのうちの1つの画像フレームタイプである。第1の画像フレームタイプの第1の画像フレームのピクセルに少なくとも部分的に基づいて、1つまたは複数の第1のコンテンツ光レベルが、符号化ビデオシーケンス内の画像フレームの第1の適切なサブセットについて生成される。画像フレームの第1の適切なサブセットは、第1の画像フレームを含む。第1の出力画像タイプとは異なる第2の画像フレームタイプの第2の画像フレームのピクセルに少なくとも部分的に基づいて、1つまたは複数の第2のコンテンツ光レベルが、符号化ビデオシーケンス内の画像フレームの第2の適切なサブセットについて生成される。画像フレームの第2の適切なサブセットは、第2の画像フレームを含む。画像フレームの第1の適切なサブセットは、画像フレームの第2の適切なサブセットと共通の画像フレームを共有しない。符号化ビデオシーケンスは、1つまたは複数の第1のコンテンツ光レベルおよび1つまたは複数の第2のコンテンツ光レベルを含む画像メタデータと共に、画像ビットストリームで送信される。
本明細書で説明される例示的な実施形態は、ビデオデータを用いてコンテンツ光レベル情報を復号することに関する。符号化ビデオシーケンスを含む画像ビットストリームは、1つまたは複数の第1のコンテンツ光レベルおよび1つまたは複数の第2のコンテンツ光レベルを含む複数の画像フレームおよび画像メタデータに復号される。複数の画像フレーム内の各画像フレームは、複数のフレームインターバル内のそれぞれのフレームインターバルについてレンダリングされる。複数の画像フレーム内の各画像フレームは、完全にインターリーブされていない画像フレームタイプ、完全にインターリーブされた画像フレームタイプ、および部分にインターリーブされておらず部分的にインターリーブされた画像フレームタイプなどを含む複数の画像フレームタイプのうちの1つの画像フレームタイプである。1つまたは複数の第1のコンテンツ光レベルは、画像フレームの第1の適切なサブセット内の第1の画像フレームタイプの第1の画像フレームのピクセルに少なくとも部分的に基づいて、符号化ビデオシーケンス内の画像フレームの第1の適切なサブセットについて生成される。1つまたは複数の第2のコンテンツ光レベルは、第1の出力画像タイプとは異なる第2の画像フレームタイプの第2の画像フレームのピクセルに少なくとも部分的に基づいて、符号化ビデオシーケンス内の画像フレームの第2の適切なサブセットについて生成される。画像フレームの第2の適切なサブセットは、第2の画像フレームを含む。画像フレームの第1の適切なサブセットは、画像フレームの第2の適切なサブセットと共通の画像フレームを共有しない。1つまたは複数の第1のコンテンツ光レベルに少なくとも部分的に基づいて、1つまたは複数の第1の画像処理動作が、画像フレームの第1の適切なサブセットについて実行されて、ターゲット表示装置のために最適化された表示画像の第1のサブセットが生成される。表示画像の第1のサブセットは、ターゲット表示装置上にレンダリングされる。1つまたは複数の第2のコンテンツ光レベルに少なくとも部分的に基づいて、1つまたは複数の第2の異なる画像処理動作が、画像フレームの第2の適切なサブセットについて実行されて、ターゲット表示装置のために最適化された表示画像の第2のサブセットが生成される。表示画像の第2のサブセットは、ターゲット表示装置上にレンダリングされる。
ビデオ配信処理パイプラインの例
図1は、ビデオキャプチャからビデオコンテンツ表示までの様々な段階を示すビデオ配信パイプライン(100)の例示的なプロセスを示す。様々なシステム構成要素は、ソフトウェア、ハードウェア、またはソフトウェアとハードウェアの組合せを介して実現することができる。これらのシステム構成要素のいずれか、いくつか、またはすべては、相互接続され、直接に、または1つまたは複数のネットワークを介して通信され得る。
一連のビデオフレーム(102)は、画像生成ブロック(105)を使用して取り込みまたは生成される。ビデオフレーム(102)は、ビデオデータ(107)を提供するために(例えば、デジタルカメラによって)デジタル的に取り込まれてもよく、または(例えば、コンピュータアニメーションを使用して)コンピュータによって生成されてもよい。あるいは、ビデオフレーム(102)は、フィルムカメラによってフィルム上に取り込まれてもよい。フィルムは、ビデオデータ(107)を提供するためにデジタルフォーマットに変換される。プロダクション段階(110)では、ビデオデータ(107)が編集されて、ビデオ制作ストリーム(112)が提供される。
次に、プロダクションストリーム(112)のビデオデータが、ポストプロダクション編集(115)のためにプロセッサに提供される。ポストプロダクション編集(115)はビデオクリエータの創作意図に従って、画質を向上させるかまたは画像の特定の外観を達成するために、画像の特定の領域における色または明るさを調整または修正することを含むことができる。これは、「カラータイミング」または「カラーグレーディング」と呼ばれることがある。他の編集(例えば、シーン選択およびシーケンシング、手動および/または自動シーンカット情報生成、画像クロッピング、コンピュータ生成視覚特殊効果の追加など)はポストプロダクション編集(115)で実行されて、HDR画像またはSDR画像を表すピクセル値のアレイ(例えば、モノクロフォーマットの輝度サンプルのアレイ、輝度サンプルのアレイ、およびカラーフォーマットの2つの対応するクロマサンプル、RGBサンプルのアレイなど)をそれぞれが備える、画像フレーム(117)の解放バージョンを生成することができる。
画像フレーム(117)は、符号化ビデオシーケンスの設定に符号化されてもよい。符号化ビデオシーケンス(CVS)は、連続するフレームインターバル(同じ時間順序)のシーケンス(単数または複数)について、下流の表示装置によって(同じ時間順序で)レンダリングされる連続する(時間順序で)画像フレームのシーケンス(単数または複数)を含むことができる。符号化ビデオシーケンス内の各画像フレームは、連続するフレームインターバルのシーケンス内の異なる各フレームインターバルについてレンダリングされる(指定される)。符号化ビデオシーケンス内の複数の画像フレーム内の各画像フレームは、完全にインターリーブされていない画像フレームタイプ、完全にインターリーブされた画像フレームタイプ、部分非的にインターリーブされておらず部分的にインターリーブされている画像フレームタイプなどを含む複数の画像フレームタイプのうちの1つの画像フレームタイプである。
ポストプロダクション編集(115)中に、画像フレーム(117)に表されるHDRまたはSDR画像は、画像フレーム(117)に表されるHDRまたはSDR画像(117)についてポストプロダクション編集操作を実行しているカラーリストによって、基準ダイナミックレンジをサポートする基準ディスプレイ(例えば、基準HDRディスプレイ、基準SDRディスプレイなど)上で見ることができる。
画像フレーム(117)内の符号化ビデオシーケンスは、符号化ブロック(120)によって画像ビットストリーム(122)に圧縮(または符号化)される。一部の実施形態において、符号化ブロック(120)は画像ビットストリーム(122)を生成するために、ATSC、DVB、DVD、Blu-Ray、HEVC、AVC、H.265、H.264、およびその他の配信形式で定義されるものなどのオーディオおよびビデオエンコーダを含むことができる。
いくつかの実施形態では、画像ビットストリーム(122)は、HDRまたはSDR画像がポストプロダクション編集(115)で生成される芸術的意図を保存するHDRまたはSDR画像(画像フレーム(117)内)で符号化される。
画像フレーム(117)は、多種多様なHDRまたはSDR表示装置(例えば、HDRディスプレイ、SDRディスプレイなど)と後方互換性がある(または代替的に後方互換性がない)ビデオ信号(例えば、8ビットSDRビデオ信号、10ビットSDRビデオ信号など)中のビデオデータに符号化され得る。
符号化ビットストリーム(122)は、ダウンストリームデコーダが関連する画像処理操作を実行するために使用できる、局所減光操作のための画像メタデータ部分、大域減光操作のための画像メタデータ部分、表示管理(DM)操作のための画像メタデータ部分、符号語マッピングのための画像メタデータなど、のいくつかまたはすべてを含むがこれに限定されない画像メタデータでさらに符号化される。
次いで、画像ビットストリーム(122)は、テレビジョンセット、セットトップボックス、映画館などの復号および再生装置にダウンストリームで配信される。受信者(または下流装置)において、画像ビットストリーム(122)は、例えば符号化ブロック(120)および復号ブロック(130)によって生成された、符号化エラーまたは定量化エラーの対象となる画像フレーム(117)に表されるHDRまたはSDR画像と同じであり得る復号画像(182)を生成するように、復号ブロック(130)によって復号される。第1のターゲットディスプレイ140-1が画像フレーム(117)内に表されるHDRまたはSDR画像がカラーグレード付けされる基準ディスプレイ(125)の同じ表示能力をサポートするシナリオでは、復号画像(182)をレンダリングし、第1のターゲットディスプレイ(140-1)上で直接見ることができる。いくつかの実施形態では、受信機は、基準ディスプレイ(125)の同じ表示能力をサポートしないことがある第2のターゲットディスプレイ140に取り付けることができる。その場合、復号ブロック(130)は、第2のターゲットディスプレイ(140)のための最適化された表示画像(137)を生成するために、復号された画像(182)に関して、ローカル調光動作のための画像メタデータ部分に基づく表示装置固有のローカル調光動作、グローバル調光動作のための画像メタデータ部分に基づく表示装置固有のグローバル調光動作、DM動作のための画像メタデータ部分に基づく表示装置固有のDM動作など、装置固有の画像処理動作135を実行することができる。
圧縮メタデータによるSDRまたは非SDRコンテンツの配信
本明細書で説明する技法を使用して、DM動作で使用されるDMメタデータを含むがこれに限定されない画像メタデータを大幅に圧縮することができる。これらの技術は広範な異なる動作シナリオに適しており、画像メタデータを圧縮して、画像メタデータの送信におけるオーバヘッドを著しく最小化し、したがって、画像メタデータおよび画像データを比較的低いビットレートで送信することを可能にするために使用することができる。いくつかの実施例では、本明細書に記載する技術がSDR画像(117)に付随する画像メタデータを圧縮するために行われてもよく、これには、比較的低いビットレートで画像ビットストリーム(122)内で送信できるSDR画像(117)と画像メタデータを有するSDR画像を許容するようにするDMメタデータが含まれるが、これらに限定されない。
過去数十年間に世界中で大量のビデオ/ムービーが、比較的低いビットレートで伝送するために符号化されたSDRコンテンツとして作成、記憶、および/または公表されてきたので、本明細書に記載する技術は、以前に作成された広範囲のSDRコンテンツを運ぶ、または後方互換性のある符号化ストリームにおいて、著しく圧縮された画像メタデータを生成するために使用することができる。その結果、画像メタデータは比較的大量のデータを運ぶことができ、多種多様な表示装置および/またはメディアプレーヤに対するDM動作を含むがこれに限定されない画像処理動作の最適化を可能にする。
さらに、オプションまたは代替として、これらの技法を拡張して、単一層ビデオ信号であってもなくてもよい符号化ストリーム中に著しく圧縮された画像メタデータを生成することもできる。さらに、オプションまたは代替として、これらの技術を拡張して、画像ビットストリームからSDR、非SDRまたはHDRコンテンツを生成するために使用できる符号化ストリーム内に、大幅に圧縮された画像メタデータを生成することもできる。
いくつかの実施形態では、画像メタデータの圧縮は、現場または新しい配備において、多種多様なメディア処理装置によってサポートされる拡張ブロック(またはメタデータブロック)を使用して実現することができる。より具体的には、拡張ブロックは、以前に作成されたSDRコンテンツに付随する画像メタデータを圧縮するために使用することができ、また、多種多様なビットレートで符号化された現在または将来のSDR(またはSDR以外のメディアコンテンツ)に付随する現在または将来の画像メタデータを圧縮するために使用することができる。いくつかの実施形態では、技法の少なくとも一部(例えば、クライアント側、デコーダ側など)は、DM動作を含むがこれに限定されない多種多様な画像処理動作において、SDR(または非SDRコンテンツ)に付随する著しく圧縮された画像メタデータを受信し、利用するために、多種多様なTV、モバイル装置、セットトップボックス、スマートプレーヤなどによって実装され、またはそれらに配備されることができる。
さらに、SDRコンテンツがSDR表示装置のために特に最適化される動作シナリオでは、そのような(例えば、後方互換性などの)SDRコンテンツは、SDRレンダリングのみをサポートする装置を含むがそれに限定されない多種多様な下流復号装置に配信され得る。これらの装置は、SDRコンテンツに付属し、装置でサポートされていない画像メタデータの部分(サポートされていないDM拡張ブロックなど)を無視できる。
例えば、本明細書に記載するような圧縮フォーマットの画像メタデータを含む画像ビットストリームを受信する第1のデコーダ(例えば、フィールドに既に配備されているデコーダなど)を有する第1の装置は、画像メタデータを圧縮するために使用されるいくつかの比較的新しい拡張ブロックを認識せず、装置に既知またはアクセス可能なデフォルト値(例えば、DM静的値など)を使用するためにフォールバックすることができる。第1のデコーダは、第1のデコーダでサポートされている圧縮形式で、画像メタデータの他の部分の復号と処理を保持できる。
比較すると、このような画像ビットストリームを受信する第2のデコーダ(例えば、新しくリリースされたデコーダなど)を有する第2の装置は、比較的新しい拡張ブロックを認識することができ、画像ビットストリーム内の圧縮画像メタデータを解凍し、比較的新しい拡張ブロック内の動的または受け取った(passed-in)値に基づいて画像処理動作(例えば、DM動作など)を実行することができる。比較的新しい拡張ブロックなどの圧縮フォーマットは、DM動作を含むがこれに限定されない多種多様な画像処理動作において、SDRまたは非SDRコンテンツに付随する著しく圧縮された画像メタデータを受信し、利用するために、多種多様なTV、モバイル装置、セットトップボックス、スマートプレーヤなどによって実装または配備され得る。
符号化ビデオシーケンス
図2Aは、連続する画像フレーム(例えば、206-1-1、206-1-2、206-2-1、206-2-2など)の列を構成する画像フレームを例示したものである(例えば、図1の117など)。連続する画像フレームのシーケンスは、(例えば、通常の再生、メディア再生などの)時間次元202にわたる連続する時間ポイントのシーケンスに対応し得る。画像フレームのシーケンス内の各画像フレームは、連続する時点のシーケンス内の時間次元(202)内のそれぞれの時点に対応することができ、それぞれの時点またはその付近のそれぞれのフレームインターバルについて表示装置によってレンダリングされる(指定される)ことができる。
図2Aに示すように、連続する画像フレームのシーケンスは、第1の符号化ビデオシーケンス204-1、第2の符号化ビデオシーケンス204-2などの複数の符号化ビデオシーケンスに分割されてもよい。いくつかの実施形態では、これらの符号化ビデオシーケンスのうちの任意の2つは相互に排他的である(または重複しない)。複数の符号化ビデオシーケンス内の各符号化ビデオシーケンスは、画像フレームのそれぞれのセットを含む。例えば、第1の符号化ビデオシーケンス(204-1)は、画像フレーム(206-1-1、206-1-2など)の第1のセットを含むことができる。第1の符号化ビデオシーケンス(204-1)の後に(例えば、直ちになど)続く第2の符号化ビデオシーケンス(204-2)は、画像フレーム(206-2-1、206-2-2など)の第2のセットを備えることができる。
図2Bは、(例えば、虚像、物理像、基準面などの)画像レンダリング面にわたるピクセル位置(またはサンプル位置)のアレイにおいて、208-1、208-2などのピクセル(またはサンプル)のアレイを含む例示的な画像フレーム(206)を示す。図示のように、画像フレーム(206)内のピクセルのアレイは、214-1、214-2、214-3などの複数のピクセル行(またはサンプル行)に分割することができる。ピクセル行は画像レンダリング面の第1の空間次元(例えば、水平次元など)に対応することができるが、必ずしもこれに限定されない。複数のピクセル行は、画像レンダリング面の第2の異なる空間次元(例えば、垂直次元など)に沿って行シーケンスインデックスを用いて順序付けられてもよい。
本明細書で説明する画像フレームは、多種多様な色空間(例えば、YCbCr、RGB、IPT、ICpCt、線形色空間、非線形色空間、知覚量子化ベースの色空間など)および/または色フォーマット(例えば、4:4:4、4:2:2、4:2:0など)のいずれかで表すことができることに留意されたい。さらに、オプションまたは代替として、画像フレームは、色空間変換動作、色フォーマット変換動作、再サンプリング動作などによって、異なる色空間および/または異なる色フォーマットで表すことができる。したがって、本明細書で説明する画像フレームは、単色フォーマットの輝度サンプルのアレイ、または輝度サンプルのアレイ、および(例えば、4:4:4、4:2:2、4:2:0など)色フォーマットの2つの対応するクロマサンプルによって、(例えば、少なくとも概念的になど)表すことができる。
限定ではなく例として、画像ビットストリーム(例えば、図1の122など)に符号化される画像フレーム(206)は、RGBピクセルのアレイを備えることができ、その各々は特定のピクセル位置に対応し、赤(R)サブピクセル、緑(G)サブピクセル、および青(B)サブピクセルを備える。
いくつかの実施形態では、符号化ビデオシーケンス内の画像フレームのセット(単数または複数)内の各画像フレームが、複数の画像フレームタイプのうちの1つの画像フレームタイプである。本明細書で説明される例示的な画像フレームタイプは、完全にインターリーブされていない画像フレームタイプ、完全にインターリーブされた画像フレームタイプ、部分的にインターリーブされておらず部分的にインターリーブされた画像フレームタイプなどのうちの1つまたは複数を含むことができるが、必ずしもこれらに限定されない。
画像フレーム(206)が完全にインターリーブされていない画像フレームタイプである場合、画像フレーム(206)内のすべてのピクセル行(またはすべてのピクセル行内のすべてのピクセル)は、表示装置によって、フレームインターバルについて、単一の画像フィールド内に同時にレンダリングされる(指定される)。
画像フレーム(206)を単一の画像フィールドとしてレンダリングするためにラスタ走査が使用される動作シナリオでは、単一の画像フィールド内のピクセル行が、ピクセル行の行シーケンスインデックスと同じ順序でレンダリングするために走査される。これらの動作シナリオでは、第1のピクセル行(214-1)が最初にラスタ走査され、第2のピクセル行(214-2)が続き、さらに第3のピクセル行(214-3)が続く。
画像フレーム(206)が完全にインターリーブされた画像フレームタイプのものである場合、画像フレーム(206)内のピクセル行は、2つの異なる画像フィールド(上部画像フィールドおよび下部画像フィールド)にグループ化または分割される。例えば、奇数番目のピクセル行は上部画像フィールドに分割またはグループ化されてもよく、一方、偶数番目のピクセル行は下部画像フィールドに分割またはグループ化される。フレームインターバルは、2つのフレームサブインターバルに分割される。上部および下部画像フィールドの各々におけるすべてのピクセル行は、表示装置によってフレームインターバルのそれぞれのフレームサブインターバルについて同時にレンダリングされる(指定される)。
画像フレーム(206)をレンダリングするためにラスタ走査が使用される動作シナリオでは、画像フレーム(206)のそのような各画像フィールド内のピクセル行を、その画像フィールド内のピクセル行の行シーケンスインデックスと同じ順序でレンダリングするために走査することができる。これらの動作シナリオでは、画像フレーム(206)のトップ画像フィールドをレンダリングするように指定されたフレームインターバルの第1のフレームサブインターバルについて、トップ画像フィールドの第1のピクセル行(214-1)が最初にラスタスキャンされ、トップ画像フィールドの第3のピクセル行(214-3)が続き、以下同様であり、ボトム画像フィールドの第2のピクセル行(214-2)などの偶数番号のピクセル行は第1のフレームサブインターバルについてレンダリングされない。逆に、画像フレーム(206)のボトム画像フィールドをレンダリングするように指定されたフレームインターバルの第2の異なるフレームサブインターバルについて、ボトム画像フィールドの第2のピクセル行(214-2)は最初にラスタスキャンされ、次にボトム画像フィールドの次の偶数番号のピクセル行(図示せず)が続き、以下同様であり、トップ画像フィールドの第1のピクセル行(214-1)のような奇数番号のピクセル行は、第2のフレームサブインターバルについてレンダリングされない。
図2Cは、部分的にインターリーブされておらず部分的にインターリーブされた画像フレームタイプである画像フレーム(206-1)を示す。図示されるように、画像領域輪郭(210)は画像フレーム(206-1)内で決定または描写されてもよく、画像フレーム(210)を、ピクセル(例えば、208-3など)を含む第1の画像領域(212-1)(例えば、画像領域輪郭(210など)によって囲まれる)、ピクセル(例えば、208-4など)を含む第2の画像領域(212-2)(例えば、画像領域輪郭(210など)の外側)などのような異なる画像領域に分割するために使用されてもよい。いくつかの実施形態では、画像フレーム(206-1)の異なる画像領域において、異なるインターレースパターンを実施することができる。
一例では、第1の画像フィールドおよび第2の画像フィールド(内のピクセル行またはサンプル行)が第1の画像領域(212-1)内でインターリーブされてもよく、(第3の画像フィールド(内のピクセル行またはサンプル行)のみが第2の画像領域(212-2)内で使用されてもよい。第2の画像領域(212-2)を占める第3の画像フィールド内のピクセルは、画像フレーム(206-1)がレンダリングされる(指定される)フレームインターバルについて、レンダリングされる(指定される)ことができる。第1の画像領域(212-1)の一部(例えば、奇数行)を占める第1の画像フィールド内のピクセルは、フレームインターバルの第1のフレームサブインターバルについてレンダリングされる(指定される)ことができる。第1の画像領域(212-1)の第2の部分(例えば、偶数行)を占める第2の画像フィールド内のピクセルは、第1のフレームサブインターバルに続くフレームインターバルの第2のフレームサブインターバルについてレンダリングされる(指定される)ことができる。
別の例では、第4の画像フィールドおよび第5の画像フィールド(内のピクセル行またはサンプル行)が第2の画像領域(212-2)内でインターリーブされてもよく、第6の画像フィールド(内のピクセル行またはサンプル行)のみが、第1の画像領域(212-1)内で使用されてもよい。第1の画像領域(212-1)を占める第6の画像フィールド内のピクセルは、画像フレーム(206-1)がレンダリングされるように指定されるフレームインターバルについて、レンダリングされる(指定される)ことができる。第2の画像領域(212-2)の一部(例えば、偶数行)を占める第4の画像フィールド内のピクセルは、フレームインターバルの第1のフレームサブインターバルについてレンダリングされる(指定される)ことができる。第2の画像領域(212-2)の第2の部分(例えば、奇数行)を占める第5の画像フィールド内のピクセルは、第1のフレームサブインターバルに続くフレームインターバルの第2のフレームサブインターバルについてレンダリングされる(指定される)ことができる。
本明細書で使用されるように、画像領域輪郭(210)は、オブジェクトセグメンテーション技法、面/オブジェクト検出、動き検出(例えば、異なる画像領域における異なる動き性質)などのうちの1つまたは複数を使用して、画像コンテンツ(例えば、ピクセルにおける値の空間分布および統計など)に基づいて描写され得る。さらに、オプションまたは代替として、(例えば、カラーリスト、ビデオプロフェッショナル、メディア処理システムのオペレータなどからの)手動入力を使用して、本明細書で説明する画像領域輪郭を指定または決定することができる。
いくつかの実施形態では、部分的にインターリーブされた部分的にインターリーブされていない画像フレーム内の1つまたは複数の画像領域が観察者の中心視覚をカバーするために使用されてもよく、一方、部分的にインターリーブされた部分的にインターリーブされていない画像フレーム内の1つまたは複数の他の画像領域は、例えば、ビデオ表示アプリケーション、拡張現実(AR)ビデオアプリケーション、仮想現実(VR)ビデオアプリケーション、混合現実(MR)ビデオアプリケーション、ゲームアプリケーション、リモートプレゼンスアプリケーションなどにおいて、観察者の非中心視覚をカバーするために使用されてもよい。
いくつかの実施形態では、部分的にインターリーブされた部分的にインターリーブされていない画像フレーム内の1つまたは複数の画像領域は、高速で動くオブジェクト/図形を描写するために使用されてもよく、一方、部分的にインターリーブされた部分的にインターリーブされていない画像フレーム内の1つまたは複数の他の画像領域は、動画、放送などを含むが必ずしもこれらに限定されないビデオアプリケーション内の他のオブジェクト/図形/背景をカバーするために使用されてもよい。
図2Dは、同じタイプの画像フレームを含む例示的な符号化ビデオシーケンス(例えば、図2Aの第1の符号化ビデオシーケンス(204-1)など)を示す。本明細書で説明されるような画像フレーム(例えば、図1の117など)は、プロダクション相(例えば、図1の110など)および/またはポストプロダクション編集相(例えば、図1の115など)において、入力ビデオデータ(例えば、図1の107など)から生成(例えば、作成、編集など)され得る。第1の符号化ビデオシーケンス(204-1)内の画像フレームのセット(単数または複数)内の各画像フレームは、入力ビデオデータ(107)内の1つ、2つ以上の画像の一部またはすべてから生成されてもよい。
より具体的には、符号化ビデオシーケンスは、単一の画像フレームタイプの画像フレームを備える(例えば、符号化される、符号化するために使用される、など)ことができる。一例では、符号化ビデオシーケンスは画像フレームを含むことができ、そのすべては完全にインターリーブされていない画像フレームタイプのものである。別の例では、符号化ビデオシーケンスは画像フレームを含むことができ、そのすべては完全にインターリーブされた画像フレームタイプである。さらに別の例では、符号化ビデオシーケンスは画像フレームを含むことができ、図2Cに示すように、そのすべては部分的にインターリーブされた部分的にインターリーブされていない画像フレームタイプである。
限定ではないが例示として、第1の符号化ビデオシーケンス(204-1)内の画像フレームのセット内の第1の画像フレーム(206-1-1)は、入力ビデオデータ(107)内のソース画像の第1のセット(216-1)のいくつかまたはすべてから生成され得る。第1の符号化ビデオシーケンス(204-1)内の画像フレームのセット内の第2の画像フレーム(206-1-2)は、入力ビデオデータ(107)内のソース画像の第2のセット(216-2)の一部またはすべてから生成されてもよい。
第1の符号化ビデオシーケンス(204-1)内の画像フレーム内の異なる画像フィールドは、入力ビデオデータ(107)内の異なるソース画像からそれぞれ生成することができる。さらに、オプションまたは代替として、いくつかの実施形態では、第1の符号化ビデオシーケンス(204-1)内の画像フレーム内の少なくとも2つの異なる画像フィールドは、入力ビデオデータ(107)内の同じソース画像から(例えば、完全に、部分的になど)生成することができる。
図2Eは、2つ以上の異なるタイプの画像フレームを備える例示的な符号化ビデオシーケンス(例えば、図2Aの第2の符号化ビデオシーケンス(204-2)など)を示す。
より具体的には、第2の符号化ビデオシーケンス(204-2)は、複数の画像フレームタイプのうちの2つ以上の異なる画像フレームタイプの画像フレームを含むことができる。一例では、符号化ビデオシーケンスは画像フレームを含むことができ、そのすべては完全にインターリーブされていない画像フレームタイプまたは完全にインターリーブされた画像フレームタイプのいずれかである。別の例では、符号化ビデオシーケンスは画像フレームを含むことができ、そのすべては完全にインターリーブされていない画像フレームタイプまたは部分的にインターリーブされた部分的にインターリーブされていない画像フレームタイプのいずれかである。さらに別の例では、符号化ビデオシーケンスは画像フレームを含むことができ、そのすべては完全にインターリーブされた画像フレームタイプまたは完全にインターリーブされていない画像フレームタイプのいずれかである。さらに、オプションまたは代替として、符号化ビデオシーケンスは画像フレームを含むことができ、そのうちのいくつかは完全にインターリーブされた画像フレームタイプであり、そのうちのいくつかは完全にインターリーブされていない画像フレームタイプであり、またはそのうちのいくつかは部分的にインターリーブされた部分的にインターリーブされていない画像フレームタイプである。
限定ではないが例示として、第2の符号化ビデオシーケンス(204-2)内の画像フレームのセット内の第3の画像フレーム(206-2-1)は、入力ビデオデータ(107)内のソース画像の第3のセット(216-3)の一部またはすべてから生成されてもよい。第2の符号化ビデオシーケンス(204-2)内の画像フレームのセット内の第4の画像フレーム(206-2-2)は、入力ビデオデータ(107)内のソース画像の第4のセット(216-4)の一部またはすべてから生成されてもよい。第2の符号化ビデオシーケンス(204-2)内の画像フレームのセット内の第5の画像フレーム(206-2-3)は、入力ビデオデータ(107)内のソース画像の第5のセット(216-5)の一部またはすべてから生成されてもよい。
前述のように、本明細書で説明するように、画像ビットストリーム(例えば、図1の122など)で符号化された画像フレーム(例えば、図1の117など)内の画像フレーム(例えば、図2Dの206-1-1、図2Dの206-1-2、図2Eの206-2-1、図2Eの206-2-2、図2Eの206-2-3など)は、画像フレーム(図1の117)が対応する(図2Aの102などの時間次元内の)連続する時点のシーケンス内のそれぞれの時点に対応する。図3Cに示すように、第3の画像フレーム(206-2-1)は、時間次元(102)内の第1の時点(218-1)に対応することができ、第1の時点(218-1)またはその付近の第1のフレームインターバルでレンダリングするために(指定される)ことができる。第4の画像フレーム(206-2-2)は、時間次元(102)において、第1の時点(218-1)に続く第2の時点(218-2)に対応することができ、第2の時点(218-2)またはその付近の第2のフレームインターバルでレンダリングするために(指定される)ことができる。第5の画像フレーム(206-2-3)は、時間次元(102)において、第2の時点(218-2)に続く第3の時点(218-3)に対応することができ、第3の時点(218-3)またはその付近の第3のフレームインターバルでレンダリングするために(指定される)ことができる。
コンテンツ光レベルに関するビデオ処理
図3Aは、画像フレームと、コンテンツ光レベルメタデータを含むがこれに限定されない対応する画像メタデータとを生成するための(例えば、図1の117など)例示的なビデオエンコーダを示す。様々なシステム構成要素は、ソフトウェア、ハードウェア、またはソフトウェアとハードウェアの組合せを介して実現することができる。これらのシステム構成要素のいずれか、いくつか、またはすべては、相互接続され、直接に、または1つまたは複数のネットワークを介して通信され得る。
画像フレーム生成器(164)は入力としてソース画像(184)を受け取り、ソース画像(184)を使用して画像フレーム(117)を生成する。いくつかの実施形態では、ソース画像(184)は、生のカメラ画像、処理されたカメラ画像、コンピュータ生成グラフィックス、オブジェクトモデルベースの画像レンダリングによって生成された画像、デジタル的にキャプチャされた、またはコンピュータ生成されたビデオフレーム(例えば、図1の102など)、編集された、またはカラーグレード化された画像(例えば、図1の112など)などのいずれかであってもよいが、必ずしもこれらに限定されない。
基準ディスプレイ(例えば、図1の125など)上で見るために最適化され得る画像フレーム(117)を生成するために、多種多様な画像処理動作における1つまたは複数の画像処理動作の任意の組合せは、ソース画像(184)上で画像フレーム生成器(164)によって実行することができる。画像フレーム生成器(164)によって実行され得る例示的な画像処理動作は、復号、符号化、トランスコーディング、色空間変換、色フォーマット変換、トーンマッピング、順方向または逆方向再整形、ブレンディング、ミキシング、クロッピング、色域変換、逆トーンマッピング、予測、非線形量子化、知覚量子化、圧縮、圧縮解除、ダウンサンプリングまたはアップサンプリングなどの空間的および/または時間的再サンプリング、デブロッキング、ノイズフィルタリング、オブジェクトセグメンテーション、オブジェクト/特徴検出、画像コンテキストおよび/またはピクセル値に基づく動作などのいずれかを含むが、必ずしもこれらに限定されない。
コンテンツ光レベル生成器(166)は入力として画像フレーム(117)を受け取り、画像フレーム(117)のコンテンツ光レベル(168)を生成する。
いくつかの実施形態では、画像フレーム生成器(164)およびコンテンツ光レベル生成器(166)の一方、いずれか、または両方は、画像フレーム(117)内の所与の(例えば、各、特定などの)画像フレームについて1つまたは複数のフレーム当たりのコンテンツ光レベルを決定することができる。本明細書で説明されるように、画像フレームから計算されるフレームごとのコンテンツ光レベルの例は、必ずしも限定されないが、画像フレームのいくつか(例えば、視覚的に関連する領域、顕著な部分、他の画像領域よりも重要であると自動的にまたは手動で識別された画像領域など)またはすべての、最大コンテンツ光レベル、平均コンテンツ光レベル、最小コンテンツ光レベルなどのいずれかを含むことができる。
いくつかの実施形態では、画像フレーム生成器(164)およびコンテンツ光レベル生成器(166)の一方、いずれか、または両方は、画像フレーム(117)内の所与の(例えば、各、特定などの)符号化ビデオシーケンスについて1つまたは複数のCVSごとのコンテンツ光レベルを決定することができる。いくつかの実施形態では、符号化ビデオシーケンス内の画像フレームは、共通の視覚特性(例えば、ダイナミックレンジ、色域、白色点、動き特性、画像特徴/オブジェクト、画像テクスチャ、同じ瞬時復号リフレッシュまたはIDRフレームまたはアクセスユニットを共有することなど)を共有することができ、符号化ビデオシーケンス内で連続することができる。さらに、オプションまたは代替として、符号化ビデオシーケンス内の画像フレームは、予測構造、依存構造、レイヤ構造、品質レベル構造、前述のもの組合せなどにおいて、同じレベル、レイヤなどを共有することができる。本明細書で説明されるように、画像フレームから計算されるCVSごとのコンテンツ光レベルの例は、最大コンテンツ光レベル(MAXCLL)、最大フレーム平均コンテンツ光レベル(MAXFALL)、最小コンテンツ光レベルなどのいずれかを含むことができるが、必ずしもそれらに限定されない。
いくつかの実施形態では、CVS単位コンテンツ光レベルは、符号化ビデオシーケンスを構成する画像フレームのセット(単数または複数)内の各画像フレームについて計算されたフレームごとのコンテンツ光レベルのいくつかまたはすべてを使用して計算することができる。限定ではなく例として、符号化ビデオシーケンスのMAXCLLなどの第1のCVS単位コンテンツ光レベルは、符号化ビデオシーケンス内の画像フレームのいくつかまたはすべてのフレームごとの最大コンテンツ光レベルとして計算することができる。符号化ビデオシーケンスのMAXFALLのような第2のCVS単位コンテンツ光レベルは、符号化ビデオシーケンス内の画像フレームの一部またはすべてのフレームごとの平均コンテンツ光レベルの最大値として計算することができる。
いくつかの実施形態では、画像フレーム生成器(164)およびコンテンツ光レベル生成器(166)の一方、いずれかまたは両方は、画像フレーム(117)内の所与の(例えば、各、特定などの)符号化ビデオシーケンスの細分割について、コンテンツ光レベルの1つまたは複数のCVSの細分割ごとに決定することができる。本明細書で使用されるように、符号化ビデオシーケンスの細分割は、符号化ビデオシーケンスの、画像フレームの複数の適切なサブセット、ピクチャのグループ、または複数のGOPにおけるGOPなどにおける画像フレームの適切なサブセットを参照することができる。いくつかの実施形態では、符号化ビデオシーケンスの細分割における画像フレームは、共通の視覚特性(例えば、ダイナミックレンジ、色域、白色点、動き特性、画像特徴/オブジェクト、画像テクスチャなど)を共有することができ、符号化ビデオシーケンスにおいて連続することができる。さらに、オプションまたは代替として、符号化ビデオシーケンスの細分割における画像フレームは、予測構造、依存構造、レイヤ構造、品質レベル構造、前記の組合せなどにおいて、同じレベル、レイヤなどを共有することができる。本明細書で説明するように、画像フレームから計算されたCVSの細分割単位コンテンツ光レベルの例は、最大コンテンツ光レベル(MAXCLL)、最大フレーム平均コンテンツ光レベル(MAXFALL)、最小コンテンツ光レベルなどのいずれかを含むことができるが、必ずしもそれらに限定されない。
いくつかの実施形態では、CVSの細分割単位コンテンツ光レベルのが、符号化ビデオシーケンスの細分割を構成する画像フレームの適切なセット(単数または複数)内の各画像フレームについて計算されたフレームごとのコンテンツ光レベルの一部またはすべてを使用して計算されてもよい。限定ではなく例として、符号化ビデオシーケンスの細分割のためのMAXCLLなどの第1のCVSの細分割単位コンテンツ光レベルは、符号化ビデオシーケンスの細分割における画像フレームの適切なサブセットのいくつかまたはすべてのフレームごとの最大コンテンツ光レベルとして計算され得る。符号化ビデオシーケンスの細分割のためのMAXFALLなどのCVSの細分割単位コンテンツ光レベルは、符号化ビデオシーケンスの細分割における画像フレームの適切なサブセットのいくつかまたはすべてのフレームごとの平均コンテンツ光レベルの最大値として計算することができる。
本明細書で説明されるコンテンツ光レベル(例えば、フレームごとのコンテンツ光レベル、CVSの細分割単位コンテンツ光レベル、CVSごとのコンテンツ光レベル、前述のいくつかまたはすべてからさらに計算されたメディア番組ごとのコンテンツ光レベルなど)は限定されないが、線形値(例えば、ニト(nit)で表される物理的光強度レベルに線形に比例するか、または線形に変換可能でなど)、または非線形値(例えば、ニト(nit)で表される物理的光強度レベルに非線形に変換可能でなど)として表され得る。いくつかの実施形態では、画像フレームのピクセルで表される、ルマコードワード(例えば、IPTまたはICtCp色空間におけるI値、YCbCr色空間におけるY値など)、クロマコードワード(例えば、IPTにおけるP値およびT値、ICtCp色空間におけるCt値およびCp値、YCbCr色空間におけるCb値およびCr値など)、色成分コードワード(例えば、RGB空間におけるR値、G値およびB値など)は線形値であってもよいし、線形値でなくてもよい。様々な実施形態では、コンテンツ光レベルが線形値として生成されるか非線形値として生成されるかにかかわらず、画像フレームのピクセル内に表されるコードワードは、ガンマコーディングまたはハイブリッドログガンマ(HLG)コーディングに関連するものなどの非線形非知覚量子化コードワードマッピング関数(例えば、非線形非PQ電気光学伝達関数またはEOTFなど)、非線形PQコードワードマッピング関数(例えば、非線形PQ EOTFなど)、線形マッピング関数(例えば、露出設定などに基づく)などのうちの1つまたは複数に基づいて生成され得る。
いくつかの実施形態では、画像メタデータ生成器(170)(例えば、符号化ブロック(120)の一部など)は、画像フレーム(117)およびコンテンツ光レベル(168)を入力として受信し、グローバル調光メタデータ、ローカル調光メタデータ、DMメタデータなどの画像メタデータ(176)を生成する。本明細書で説明されるような、フレームごと、CVSの細分割ごと、CVSごとなどのコンテンツ光レベルのいくつかまたはすべてを、コンテンツ光レベル(168)に含めることができる。一例では、CVSごとのコンテンツ光レベルのみが、画像メタデータ(176)において下流の装置に送信される。別の例では、本明細書で説明するように、フレームごと、CVSの細分割ごと、CVSごとなどのコンテンツ光レベルの任意の組合せを、画像メタデータ(176)で送信することができる。
図3Aに示すように、圧縮ブロック(142)(例えば、図1の符号化ブロック(122)などの一部)は、ビデオ信号(174)内の画像フレーム(117)を圧縮/符号化する。ビデオ信号の一例は、図1の画像ビットストリーム(122)であってもよいが、必ずしもこれに限定されない。画像フレーム(117)、コンテンツ光レベル(168)などに基づいて画像メタデータ生成器(170)によって生成される画像メタデータ(176)は、(例えば、図1の符号化ブロック(122)などによって)ビデオ信号に符号化され得る。
画像メタデータ(176)は、画像フレームから、インバンドで搬送されるか、またはビデオ信号内の圧縮画像フレーム(117)に埋め込まれてもよく、または、(追加的に、または代替的に)ビデオ信号内で(例えば、別個のメタデータコンテナ内で、別個のビットストリーム内で、指定されたサブストリーム内で、コンポーネントストリーム内でなど)別個に搬送されてもよい。例えば、画像メタデータ(176)は画像ビットストリーム内の構成要素ストリーム内で符号化されてもよく、この構成要素ストリームは画像フレーム(117)が符号化される(画像ビットストリームの)他の構成要素ストリームから分離されていてもいなくてもよい。
画像メタデータ(176)は、参照ディスプレイ(125)と同一の表示能力を有していても、有していなくてもよい異なるターゲットディスプレイについて、異なるターゲット装置固有の画像を直接符号化することを避けるために使用することができる。その代わりに、ビデオ信号内の画像メタデータ(176)を使用して、異なるターゲットディスプレイで動作する下流復号装置が復号画像(例えば、図1の182)を最適化することができる画像処理/レンダリング動作を実行して、これらのターゲットディスプレイのそれぞれについてそれぞれ最適化された表示画像を生成し、ターゲットディスプレイが、画像フレーム(117)が最適化される基準ディスプレイ(125)と同じ表示能力を有するかどうかにかかわらず、これらの異なるターゲットディスプレイ上の画像フレーム(117)内に表される画像コンテンツを有する最適化された表示画像をレンダリングすることを可能にすることができる。
いくつかの実施形態では、コンテンツ光レベルメタデータの一部またはすべてを、画像フレーム(117)と共にビデオ信号(174)で送信される1つまたは複数の補足的エンハンスメント情報(SEI)メッセージに符号化することができる。本明細書に記載するようなコンテンツ軽量レベル情報SEIメッセージを符号化するために使用されるシンタックスの例を、以下の表1に示す。さまざまな実施形態では、表1に示すように、より多くまたはより少ないシンタックス要素を有する別のシンタックスを使用して、SEIメッセージ内のコンテンツライトレベル情報を符号化することができることに留意されたい。
Figure 0007027554000001
このSEIメッセージシンタックスは、符号化ビデオシーケンスのフレームのいずれか、いくつか、またはすべての公称ターゲット輝度光レベルの上限を識別する。例えば、表1に示すように、シンタックスで符号化されたSEIメッセージを使用して、符号化ビデオシーケンス内の1つまたは複数の個々のフレーム、符号化ビデオシーケンスの1つまたは複数の個々の細分割、符号化ビデオシーケンス全体、1つまたは複数の符号化ビデオシーケンス、入力ビデオ信号/ソース、メディアプログラム(例えば、ライブ放送、TVプログラムなど)などの公称ターゲット輝度光レベルの上限を識別することができる。
非限定的な例示的実施形態では、SEIメッセージで伝達される情報は、例えば、消費者技術協会861.3-A仕様、H.264、AVC、H.265、HEVCなどの、ビデオ符号化および/または表示に関連する独自仕様および/または業界標準の使用に対応する目的に適切であることが意図される。限定ではなく例として、いくつかの実施形態では、ビデオ信号(174)は、H.264(類似)符号化シンタックスで符号化された画像ビットストリームを表す。
コンテンツ光レベル情報SEIメッセージのセマンティクスは、平方メートル(またはニト)ごとのカンデラの単位で、符号化ビデオシーケンスのフレームの線形光領域における赤、緑、および青色原色強度の4:4:4表現におけるサンプル(またはピクセル)の値に関連して定義することができる。しかしながら、このSEIメッセージは、それ自体では、復号された画像フレームのサンプル値(またはピクセル値)を、復号された画像フレームに対応する線形光領域における赤、緑、および青色原色強度の4:4:4表現におけるRGBフレームのサンプル値に変換するための変換プロセスを識別しない。
ビデオ信号(174)がH.264符号化シンタックスで符号化された画像ビットストリームを表す動作シナリオでは、「colour_primaries」、「transfer_characteristics」、「matrix_coeffs」、およびクロマリサンプリングフィルタヒントSEIメッセージ(存在する場合)のようなH.264符号化シンタックスの他のシンタックス要素がこのような変換プロセスの識別に役立つことがある。
ビデオ信号(174)がH.264符号化シンタックスで符号化された画像ビットストリームを表す動作シナリオでは、図3Aに示されるような、H.264符号化シンタックス内の他のシンタックス要素、本明細書で説明されるようなビデオエンコーダはIDRアクセスユニット内のコンテンツ光レベル情報SEIメッセージの存在に適用するいくつかの制約(例えば、本明細書で説明されるような画像フレームを符号化するための、ビデオ信号(174)の符号化ビデオシーケンス内の符号化ユニットまたはシンタックス要素)を実装することができる。
第1の制約の下で、コンテンツ光レベル情報SEIメッセージが符号化ビデオシーケンスの任意のアクセスユニットに存在し、コンテンツ光レベル情報SEIメッセージが任意の他のSEIメッセージ内に含まれない場合、任意の他のSEIメッセージ内に含まれないコンテンツ光レベル情報SEIメッセージは、符号化ビデオシーケンスの第1のアクセスユニットであるIDRアクセスユニット内に存在する。
第2の制約の下で、コンテンツ光レベル情報SEIメッセージが符号化ビデオシーケンスの任意のアクセスユニットに存在し、コンテンツ光レベル情報SEIメッセージがdependency_id(dId)、quality_id(qId)、およびtemporal_id(tId)に適用されるスケーラブルネストSEIメッセージに含まれる場合、dIdに等しいdependency_id、qIdに等しいquality_id、およびtIdに等しいtemporal_idに適用されるスケーラブルネストSEIメッセージに含まれるコンテンツ光レベル情報SEIメッセージが、符号化ビデオシーケンスの第1のアクセスユニットであるIDRアクセスユニットに存在する。
第3の制約の下で、コンテンツ光レベル情報SEIメッセージが符号化ビデオシーケンスの任意のアクセスユニットに存在し、コンテンツ光レベル情報SEIメッセージがview_id(vId)およびtemporal_id(tId)に適用されるMVCスケーラブルネストSEIメッセージに含まれる場合、vIdに等しいview_idおよびtIdに等しいtemporal_idに適用されるMVCスケーラブルネストSEIメッセージに含まれるコンテンツ光レベル情報SEIメッセージが、符号化ビデオシーケンスの第1のアクセスユニットであるIDRアクセスユニットに存在するものとする。
第4の制約の下で、コンテンツ光レベル情報SEIメッセージが符号化ビデオシーケンスの任意のアクセスユニットに存在し、コンテンツ光レベル情報SEIメッセージがview_id(vId)およびtemporal_id(tId)を持つテクスチャビューに適用されるMVCDスケーラブルネストSEIメッセージに含まれる場合、vIdに等しいview_id、およびtIdに等しいtemporal_idを持つテクスチャビューに適用されるMVCDスケーラブルネストSEIメッセージに含まれるコンテンツ光レベル情報SEIメッセージが、符号化ビデオシーケンスの第1のアクセスユニットであるIDRアクセスユニットに存在する。
いくつかの実施形態では、コンテンツ光レベル情報SEIメッセージは、符号化ビデオシーケンスの終了まで、現在のアクセスユニットからの復号順序で持続する。
いくつかの実施形態では、コンテンツ光レベル情報SEIメッセージが、任意の他のSEIメッセージにも含まれない場合、1~5の範囲(1と5を含めて)のnal_unit_typeを有するVCL NALユニットにのみ関係する。
SEIメッセージ、スケーラブルネストSEIメッセージ、MVCスケーラブルネストSEIメッセージ、MVCDスケーラブルネストSEIメッセージ、符号化ビデオシーケンス、アクセスユニット、IDRアクセスユニット、dependency_id(dId)、quality_id(qId)、temporal_id(tId)、view_id(vId)、テクスチャビュー、デコード順序、NALユニット、VCL NALユニット、nal_unit_typeなどの例は、ITU-T H.264「Advanced video coding for generic audiovisual services」(04/2017)にある。
いくつかの実施形態では、ビットストリームがスケーラブルビデオビットストリーム(例えば、H.264規格の付属書Gなどによる)である場合、他のSEIメッセージ内に含まれないコンテンツ光レベル情報SEIメッセージはベースレイヤビットストリームにのみ適用される。ビットストリームがマルチビュービデオビットストリーム(例えば、H.264規格の付属書Hなどによる)である場合、任意の他のSEIメッセージ内に含まれないコンテンツ光レベル情報SEIメッセージは、基本レイヤビットストリームにのみ適用される。ビットストリームが深さを有するマルチビュービデオビットストリーム(例えば、H.264規格のAnnexIまたはJなどによる)である場合、任意の他のSEIメッセージ内に含まれないコンテンツ光レベル情報SEIメッセージは、基本テクスチャビューにのみ適用される。
ビデオ信号(174)がH.264符号化シンタックスで符号化された画像ビットストリームを表す動作シナリオでは、H.264符号化シンタックス内の他のシンタックス要素、図3Aに示されるような本明細書で説明されるようなビデオエンコーダは、コンテンツ光レベル情報SEIメッセージのコンテンツに適用するいくつかのさらなる制約を実装することができる。
第1のさらなる制約の下で、同じ符号化ビデオシーケンスに適用され、任意の他のSEIメッセージ内に含まれないすべてのコンテンツ光レベル情報SEIメッセージは、同じコンテンツを有する。
2番目のさらなる制約の下で、同じ符号化ビデオシーケンスに適用され、dependency_id、quality_id、およびtemporal_idの特定の値に適用されるスケーラブルネストSEIメッセージに含まれるすべてのコンテンツ光レベル情報SEIメッセージは同じコンテンツを持つ。
さらに3番目の制約の下で、同じ符号化ビデオシーケンスに適用され、view_idとtemporal_idの特定の値に適用されるMVCスケーラブルネスティングSEIメッセージに含まれるすべてのコンテンツ光レベル情報SEIメッセージは同じコンテンツを持つ。
4番目のさらなる制約の下で、同じ符号化ビデオシーケンスに適用され、view_idとtemporal_idの特定の値をもつテクスチャビューに適用されるMVCDスケーラブルネスティングSEIメッセージに含まれるすべてのコンテンツ光レベル情報SEIメッセージは同じコンテンツを持つ。
いくつかの実施形態では、前述の制約のいくつかまたはすべては、例えば、符号化ビデオシーケンスの個々のフレームまたは個々の細分割に関係するコンテンツ光レベルをシグナリングする目的で、緩和されてもよい(または実装されなくてもよい)。
いくつかの実施形態では、本明細書で説明するコンテンツ光レベルSEIメッセージ内の「max_content_light_level」が0に等しくない場合、1平方メートル当たりのカンデラの単位で、符号化ビデオシーケンスのフレームの赤、緑、および青色原色強度(線形光領域内)の4:4:4表現内のすべての個々のサンプル(またはピクセル)の中の最大光レベルの上限を示す。0に等しい場合、そのような上限は「max_content_light_level」によって示されない。
いくつかの実施形態では、本明細書に記載するコンテンツ光レベルSEIメッセージ内の「max_content_light_level_interpretation」が0に等しいかまたは等しくない場合、CTA-861.3-Aのようなビデオ符号化標準に従って「max_content_light_level」をMaxCLLとして解釈することを示す。存在し、0に等しくない場合、「max_content_light_level」はビデオ符号化標準に規定されていないものを含む他の何らかの手段によって解釈される。いくつかの実施形態では、シンタックス要素「max_content_light_level_interpretation」は、MovieLabs Common Metadata“md”namespace(TR-META-CM 2.6版 2017年12月11日)に合わせて指定または追加することができる。加えて、オプションまたは代替として、「max_content_light_level_interpretation」を計算する方法は、TR-MATA-CM、CTA-861.3などの1つとして特定のビデオ符号化標準で指定される方法と同じかまたは類似である。
ある実施形態では、本明細書に記載するようなコンテンツ光レベルSEIメッセージ内の「max_content_light_level_type」は、「max_content_light_level」の値を計算するために使用される走査タイプを示す。「max_content_light_level_type」の例の値は、以下の表2に示される「走査タイプ」の値として表されてもよい。
Figure 0007027554000002
「max_content_light_level_type」および「max_frame_average_light_level」フィールドは、それらの値がフレームレベル(プログレッシブフレーム、相補ファイルペア、MBAFFフレームなど)または個々のフィールドで計算された場合、それぞれ明確にするために使用できる。例えば、インターレースされたソースコンテンツにおける、特にライト、クロスフェード、およびディゾルブのフラッシュのために、画像フレーム内の2つのフィールドが個別ではなく一緒に平均化されると、コンテンツライトレベルの値は異なる。「max_content_light_level_type」および「max_frame_average_light_level」フィールドは、ピクチャタイミングSEIメッセージのclock_timestamp_flagが設定されている場合にのみ存在する「ct_type」シンタックス要素のような他のフィールドから推定しようとすることなく、どのように「max_content_light_level_type」および「max_frame_average_light_level」が計算されるかを確実にシグナリングするのに使用され、いくつかの作動シナリオでは、画像ビットストリーム(例えば、H.264画像ビットストリームなど)は、「ct_type」のような入力走査タイプのインジケータを持たない。さらに、これらのシナリオでは、画像ビットストリームは、画像タイミングSEIメッセージのオプションの「pic_struct」シンタックス要素以外の表示走査タイプのインジケータを持たない。したがって、「ct_type」(入力走査タイプインジケータ)および「pic_struct」(出力走査タイプインジケータ)のようなこれらのフィールドは、「max_content_light_level」が入力ソースまたは出力符号化ビデオシーケンスに適用されるかどうかを示すために拡張することはできない。
いくつかの実施形態では、本明細書に記載するコンテンツ光レベルSEIメッセージ内の「max_content_light_level_io_type」は、「max_content_light_level」の値が入力ビデオ信号/ソース、符号化ビデオシーケンス全体、または1つまたは複数の他の信号部分/セグメントに適用されるかどうかを示す。「max_content_light_level_io_type」の値の例は、以下の表3に示す「入力出力タイプ」の値として表されてもよい。
Figure 0007027554000003
上の表3では、0の値は、「max_content_light level」および「max_frame_average_light_level」のようなコンテンツ光レベル値がソースビデオからパススルーされることを示すために使用されてもよい。1の値は、コンテンツ光レベル値が圧縮後に計算され、例えばファイルベースの符号化を支援するためにビットストリームに挿入されることを示すために使用されてもよい。2の値は、ライブ符号化を支援するために、上限コンテンツ光レベル値を示すために使用されてもよい。
「max_content_light_level_io_type」および「max_frame_average_light_level_io_type」フィールドは、「max_content_light_level」および「max_frame_average_light_level」の値が入力ソースコンテンツに適用されるか、または、ファイルベースの符号化やビデオオンデマンド(Netflix、Roku、Slingなど)の場合と同様に、ビデオシーケンス全体を符号化した後に計算された値に適用されるかを明確にするために使用することができる。これらの2つのシンタックス要素を追加することにより、H.264ベースの画像ビットストリームは、番組レベルの静的メタデータがライブ放送などのコンテンツ光レベルのために生成することが困難であり得る動作シナリオにおいても、ライブ符号化およびトランスコーディングをシグナリングすることが可能になる。ライブ符号化をシグナリングすることは、さもなければディスプレイ適応システム、表示管理システム、グローバル/ローカル調光システム、ディスプレイ電力管理システムなどに利用できない有用なガイダンス情報を提供する。
いくつかの実施形態では、本明細書で説明するコンテンツ光レベルSEIメッセージ内の「max_frame_average_light_level」は、0に等しくない場合、1平方メートル当たりのカンデラの単位で、符号化ビデオシーケンスの任意の個々のフレームについての赤、緑、および青色原色強度(線形光ドメイン内)の4:4:4表現内のサンプル(またはピクセル)内の最大平均光レベルの上限を示す。0に等しい場合、そのような上限は「max_frame_average_light_level」によって示されない。
いくつかの実施形態では、本明細書に記載するようなコンテンツ光レベルSEIメッセージ内の「max_frame_average_light_level_interpretation」は、0に等しいまたは存在しない場合、「max_frame_average_light_level_interpretation」がCTA-861.3-Aのようなビデオ符号化標準に従ってMaxFALLとして解釈される。存在するまたは0に等しくない場合、「max_frame_average_light_level」がビデオ符号化標準に規定されていないものを含むがそれに限定されない何らかの他の手段によって解釈されることを示す。いくつかの実施形態では、シンタックス要素「max_frame_average_light_level_interpretation」がMovieLabs Common Metadata“md”namespace(TR-META-CM、バージョン2.6、2017年12月11日)に合わせて指定または追加することができる。さらに、オプションまたは代替として、「max_frame_average_light_level_interpretation」を計算する方法は、TR-META-CM、CTA-861.3などの特定のビデオ符号化標準で規定されている方法と同じかまたは類似するものとすることができる。
ある実施形態では、本明細書に記載するようなコンテンツ光レベルSEIメッセージ内の「max_frame_average_light_level_type」は、「max_frame_average_light_level as」の値を計算するために使用される走査タイプを示す。「max_frame_average_light_level_type」の値の例は、上の表2に示される「走査タイプ」の値として表されてもよい。
いくつかの実施形態では、本明細書に記載するようなコンテンツ光レベルSEIメッセージ内の「max_frame_average_light_level_io_type」は、「max_frame_average_light_level」の値が入力ビデオ信号/ソース、符号化ビデオシーケンス全体、ライブ符号化、または1つまたは複数の他の信号部分/セグメントに適用されるかどうかを示す。「max_frame_average_light_level_io_type」の値の例は、上の表3に示される「入力出力タイプ」の値として示される。
いくつかの実施形態では、視覚的に関連する領域がより高いクロッピングされた復号ピクチャ内の広いピクチャアスペクト比を有するビデオコンテンツの「レターボックス」符号化などの、クロッピングされた復号ピクチャ全体に対応しない場合、示されたフレーム平均は視覚的に関連する領域内でのみ実行され得る。
図3Bは、画像フレーム(例えば、182など)、およびコンテンツ光レベルメタデータを含むがこれに限定されない対応する画像メタデータ(例えば、176など)を搬送するビデオ信号(174)を処理するための例示的なビデオデコーダ(例えば、図1の復号ブロック(130など))を示す。画像フレーム(182)は、解凍ブロック(178)によってビデオ信号から受信および解凍され、可能性のある符号化エラーおよび/または量子化エラーを受ける図1または図3Aの画像フレーム(117)と同じである。画像メタデータ(176)はまた、特定の表示装置が画像フレーム(182)について装置共通および/または装置固有の画像処理動作(180)を実行して、特定の表示装置についてそれぞれ最適化された装置固有の表示画像(例えば、137など)を生成するために、画像メタデータ(176)を使用することができるように、画像フレーム(182)と共にビデオ信号において符号化され、送信される。
最適化された装置固有の表示画像(137)は、HDMIインタフェース、ビデオリンクなどを介して、ターゲット表示装置に出力され、ターゲット表示装置上にレンダリングされ得る。
本明細書で説明されるようなビデオ信号(または画像ビットストリーム)中のコンテンツ光レベル情報などの画像メタデータは、ビデオ信号から復号された画像フレームについていくつかの画像処理動作を実行させるために、受信装置によって使用され得る。
一例では、MAXFALLは、グローバル調光動作および/またはローカル調光動作および/または表示管理(DM)動作を実行して、画像フレーム内の光レベルを表示装置によってサポートされる最大フレーム平均電力消費閾値未満に再マッピングまたはスケールダウンしながら、顕著な画像部分(例えば、中間トーンなど)内の画像詳細(例えば、コントラスト、色など)を保存するために、受信装置によって使用され得る。より高い過渡的なバックライト生成能力を有する特定の表示装置の場合、ビデオ信号中の符号化ビデオシーケンスまたは画像部分のMAXFALLを使用して、比較的高いMAXFALLを有するこれらの画像フレームのいくつかまたはすべてが、最大フレーム平均電力消費閾値を一時的に超えることによって、画像フレーム中の光レベルを再マッピングまたはスケールダウンすることなく、依然として表示またはレンダリングされ得るかどうかを推定または判定することができる。
別の例では、MAXCLLは、グローバル調光動作および/またはローカル調光動作および/または表示管理(DM)動作を実行して、画像フレーム内の光レベルを表示装置によってサポートされる最大ピーク輝度閾値未満に再マッピングまたはスケールダウンしながら、顕著な画像部分(例えば、中間トーンなど)内の画像詳細(例えば、コントラスト、色など)を保存するために、受信装置によって使用され得る。より高い過渡的なローカルピークバックライト生成能力を有する特定の表示装置の場合、ビデオ信号中の符号化ビデオシーケンスまたは画像部分のMAXCLLを使用して、比較的高いMAXCLLを有するこれらの画像フレームのいくつかまたはすべてを、画像フレーム中の光レベルを再マッピングまたはスケールダウンすることなく、依然として表示またはレンダリングすることができるかどうかを推定または判定することができる。
プロセスフローの例
図4Aは、本発明の一実施形態による例示的なプロセスフローを示す。いくつかの実施形態では、1つまたは複数のコンピューティング装置またはコンポーネント(例えば、アップストリームエンコーダ、符号化装置/モジュール、トランスコーディング装置/モジュール、復号装置/モジュール、逆トーンマッピング装置/モジュール、トーンマッピング装置/モジュール、メディア装置/モジュールなど)がこのプロセスフローを実行し得る。
ブロック402において、画像処理装置(例えば、符号化ブロック(120)など)は、ピクセル(または出力サンプル、例えば、図2Cなどの208-3、208-4など)が画像のセット(例えば、図2Dまたは図2Eなどの216-1、216-2、216-3、216-4、216-5など)内のソースピクセル(または入力サンプル)から生成される、特定の画像フレーム(例えば、図2A、図2Dまたは図2Eなどの206-1-1、206-1-2、206-2-1、206-2-2など)について、特定の画像フレーム内の第1の画像フレーム部分(例えば、図2Cの第1の画像領域(212-1)など)および特定の画像フレーム内の第2の画像フレーム部分(例えば、図2Cなどの第2の画像領域(212-2)など)を決定する。特定の画像フレーム内の画像フレーム部分(例えば、図2Cの第2の画像領域(212-2)など)。特定の画像フレームは、(例えば、メディア再生などの)時間次元(例えば、図2A、図2D、または図2Eなどの202など)における複数の連続する時点におけるそれぞれの時点に対応することができ、表示装置によってフレームインターバルについてレンダリングされる(指定される)ことができる。特定の画像フレームをレンダリングする(指定する)ことができるフレームインターバルは、(例えば、その時点、その周辺など)それぞれの時点に関連付けられる。
ブロック404において、画像処理装置は、ソース画像のセット内の第1の画像および第2の画像から、それぞれ、特定の画像フレーム内の第1の画像フレーム部分にインターリーブされる第1の画像フィールドおよび第2の画像フィールドを生成する。第1の画像フィールドまたはその中のピクセルは、フレームインターバルの第1のフレームサブインターバルについてレンダリングされる(指定される)ことができる。第2の画像フィールドまたはその中のピクセルは、フレームインターバルの第2のフレームサブインターバルについてレンダリングされる(指定される)ことができる。いくつかの実施形態では、フレームインターバルの第2のフレームサブインターバルは、フレームインターバルの第1のフレームサブインターバルと少なくとも部分的に重複せず、直後に続くように(指定)されてよい。
ブロック406において、画像処理装置は、ソース画像のセット内の第3の画像から、例えば複数の画像フィールドをインターレースすることなく、特定の画像フレーム内の第2の画像フレーム部分内のすべてのピクセル位置(またはサンプル位置)を占有するために使用される第3の画像フィールドを生成する。
ブロック408では、特定の画像フレーム内の第1の画像フィールド、第2の画像フィールドおよび第3の画像フィールドのピクセル(または出力サンプル)に少なくとも部分的に基づいて、画像処理装置は符号化されたビデオシーケンス(例えば、図2Aまたは図2Dの204-1、図2Aまたは図2Eの204-2など)について、特定の画像フレームを含む複数の画像フレームで符号化される1つまたは複数のコンテンツ光レベルを生成する。
ブロック410において、画像処理装置は、画像ビットストリーム(例えば、図1の122など)において、1つまたは複数のコンテンツ光レベルを含む画像メタデータと共に、符号化ビデオシーケンスを送信する。
一実施形態では、第1の画像フレーム部分および第2の画像フレーム部分は、ソース画像のセット内のソースピクセルによって表される画像コンテンツに基づいて、特定の画像フレーム内に描写される。
一実施形態では、第1の画像フレーム部分および第2の画像フレーム部分は、第1の画像フレーム部分および第2の画像フレーム部分における画像コンテンツの視覚的特徴差に基づいて、特定の画像フレーム内に描写される。
一実施形態では、1つまたは複数のコンテンツ光レベルは、複数の画像フレーム間の最大フレーム平均コンテンツ光レベル、または複数の画像フレーム間の最大コンテンツ光レベルのうちの少なくとも1つを含む。
一実施形態では、1つまたは複数のコンテンツ光レベルは、1つまたは複数の関連フィールドを有する画像ビットストリーム内で搬送され、1つまたは複数の関連フィールドは、最大コンテンツ光レベルの解釈、最大コンテンツ光レベルのタイプ、最大コンテンツ光レベルの入出力タイプ、最大フレーム平均光レベルの解釈、最大フレーム平均光レベルのタイプ、最大フレーム平均光レベルの入出力タイプなどのうちの1つまたは複数を含む。
一実施形態では、第1の画像フレーム部分および第2の画像フレーム部分は特定の画像フレームにおいて重なり合わない。
一実施形態では、画像ビットストリームはH.264ビデオ信号を表す。
一実施形態では、画像フレームはモノクロビデオコンテンツのための輝度サンプルのアレイで表現可能である。
一実施形態では、画像フレームは輝度サンプルのアレイ、および多色ビデオコンテンツのためのカラーフォーマットにおけるクロマサンプルの2つの対応するアレイを用いて表現可能である。
一実施形態では、第1の画像フレーム部分および第2の画像フレーム部分は、特定の画像フレームで表される画像コンテンツ内の視覚的に関連する領域を集合的に表す。
一実施形態では、特定の画像フレームは部分的にインターリーブされた部分的にインターリーブされていない画像フレームタイプであり、符号化ビデオシーケンスは完全にインターリーブされた画像フレームタイプ、完全にインターリーブされていない画像フレームタイプなどのうちの1つである第2の特定の画像フレームを含む。
一実施形態では、符号化ビデオシーケンスは、部分的にインターリーブされた部分的にインターリーブされていない画像フレームタイプの画像フレームのみを含む。
一実施形態では、1つまたは複数のコンテンツ光レベルのそれぞれは、画像処理動作において、符号化ビデオシーケンス内のすべての画像フレームに適用される。
一実施形態では、1つまたは複数のコンテンツ光レベルは、符号化ビデオシーケンス内の画像フレームの適切なサブセットのみに集合的に適用される。
一実施形態では、符号化ビデオシーケンス内の画像フレームの第2の適切なサブセットは、1つまたは複数のコンテンツ光レベルと同じタイプの異なるコンテンツ光レベルで適用される。
一実施形態では、画像フレームの第1の適切なサブセットは、共通の依存性識別子を共有する。
一実施形態では、画像フレームの第1の適切なサブセットは、共通の品質識別子を共有する。
一実施形態では、画像フレームの第1の適切なサブセットは、共通の時間的識別子を共有する。
一実施形態では、画像フレームの第1の適切なサブセットは、共通ビュー識別子、共通依存性識別子、共通品質識別子などの2つ以上を共有する。
一実施形態では、1つまたは複数のコンテンツ光レベルは、1つまたは複数の補足エンハンスメント情報(SEI)メッセージ内に存在する。
一実施形態では、1つまたは複数のSEIメッセージ内のSEIメッセージは、IDRフレームで符号化された瞬時復号リフレッシュ(IDR)アクセスユニット内に存在する。
一実施形態では、第1の画像フレーム部分および第2の画像フレーム部分は、特定の画像フレームに表されるような画像コンテンツに存在するレターボックスを除外する。
図4Bは、本発明の一実施形態による例示的なプロセスフローを示す。いくつかの実施形態では、1つまたは複数のコンピューティング装置またはコンポーネント(例えば、アップストリームエンコーダ、符号化装置/モジュール、トランスコーディング装置/モジュール、復号装置/モジュール、逆トーンマッピング装置/モジュール、トーンマッピング装置/モジュール、メディア装置/モジュールなど)がこのプロセスフローを実行し得る。
ブロック422において、画像処理装置(例えば、符号化ブロック(120)など)は、複数の画像フレーム(例えば、図2Aまたは図2Eの206-2-1、206-2-2など)のための符号化ビデオシーケンス(例えば、図2Aまたは図2Eの204-2など)を生成する。符号化ビデオシーケンス内の複数の画像フレーム内の各画像フレームは、複数のフレームインターバル内の異なるそれぞれのフレームインターバルについて表示装置によってレンダリングされる(指定される)。符号化ビデオシーケンス内の複数の画像フレーム内の各画像フレームは、完全インターリーブされていない画像フレームタイプ、完全にインターリーブされた画像フレームタイプ、部分的にインターリーブされておらず部分的にインターリーブされた画像フレームタイプなどを含む複数の画像フレームタイプのうちの1つの画像フレームタイプである。
ブロック424において、第1の画像フレームタイプの第1の画像フレーム(例えば、図2Aまたは図2Eの206-2-1など)のピクセルに少なくとも部分的に基づいて、画像処理装置は、符号化ビデオシーケンス内の第2の符号化ビデオシーケンスの画像フレームのセット内の画像フレームの第1の適切なサブセットのための1つまたは複数の第1のコンテンツ光レベルを生成する。画像フレームの第1の適切なサブセットは、第1の画像フレームを含む。
ブロック426において、第1の出力画像タイプとは異なる第2の画像フレームタイプの第2の画像フレーム(例えば、図2Aまたは図2Eの206-2-2など)のピクセルに少なくとも部分的に基づいて、画像処理装置は、符号化ビデオシーケンス内の画像フレームの第2の適切なサブセットのための1つまたは複数の第2のコンテンツ光レベルを生成する。画像フレームの第2の適切なサブセットは、第2の画像フレームを含む。ここで、画像フレームの第1の適切なサブセットは、画像フレームの第2の適切なサブセットから相互に排他的であってもよく、共通の画像フレームを共有していなくてもよい。
ブロック428において、画像処理装置は、画像ビットストリーム(例えば、図1の122など)において、1つまたは複数の第1のコンテンツ光レベルおよび1つまたは複数の第2のコンテンツ光レベルを含む画像メタデータと共に、符号化ビデオシーケンスを送信する。
一実施形態では、画像フレームの第1の適切なサブセットは第1の画像フレームタイプの画像フレームを含み、画像フレームの第2の適切なサブセットは第2の異なる画像フレームタイプの画像フレームを含む。
一実施形態では、1つまたは複数の第1のコンテンツ光レベルのそれぞれは、画像処理動作において画像フレームの第1の適切なサブセット内のすべての画像フレームに適用され、1つまたは複数の第2のコンテンツ光レベルのそれぞれは、画像処理動作において画像フレームの第2の適切なサブセット内のすべての画像フレームに適用される。
一実施形態では、1つまたは複数の第1のコンテンツ光レベルは、画像フレームの第1の適切なサブセット内の少なくとも1つの画像フレームのための第1の補足エンハンスメント情報(SEI)メッセージ内に存在し、1つまたは複数の第2のコンテンツ光レベルは、画像フレームの第2の適切なサブセット内の少なくとも1つの画像フレームのための第2のSEIメッセージ内に存在する。
図4Cは、本発明の一実施形態による例示的なプロセスフローを示す。いくつかの実施形態では、1つまたは複数のコンピューティング装置またはコンポーネント(例えば、受信装置、セットトップボックス、スマートテレビ、ダウンストリームデコーダ、復号装置/モジュール、メディア装置/モジュールなど)がこのプロセスフローを実行することができる。
ブロック442において、画像処理装置(例えば、復号ブロック(130)など)は、特定の画像フレームを含む複数の画像フレームで符号化された符号化ビデオシーケンスを含む画像ビットストリームを、複数の画像フレームと、符号化ビデオシーケンスの1つまたは複数のコンテンツ光レベルを含むコンテンツ光レベルメタデータとに復号する。特定の画像フレームは、ソース画像のセット内のソースピクセルから生成されたピクセルを含み、フレームインターバルについてレンダリングされる。符号化ビデオシーケンスのための1つまたは複数のコンテンツ光レベルは、特定の画像フレーム内の第1の画像フィールド、第2の画像フィールド、および第3の画像フィールドのピクセルに少なくとも部分的に基づいて生成される。特定の画像フレーム内の第1の画像フレーム部分にインターリーブされる第1の画像フィールドおよび第2の画像フィールドは、ソース画像のセット内の第1の画像および第2の画像からそれぞれ生成される。第1の画像フィールドは、フレームインターバルの第1のフレームサブインターバルについてレンダリングされるべきであり、第2の画像フィールドは、フレームインターバルの第2のフレームサブインターバルについてレンダリングされるべきである。フレームインターバルの第2のフレームサブインターバルは、フレームインターバルの第1のフレームサブインターバルに続く。特定の画像フレーム内の第2の画像フレーム部分内のすべてのピクセル位置を占有するために使用される第3の画像フィールドは、ソース画像のセット内の第3の画像から生成される。
ブロック444において、符号化ビデオシーケンスに対する1つまたは複数のコンテンツ光レベルに少なくとも部分的に基づいて、画像処理装置は、特定の画像フレームについて1つまたは複数の画像処理動作を実行して、ターゲット表示装置について最適化された表示画像を生成する。
ブロック446において、画像処理装置は、最適化された表示画像をターゲット表示装置上にレンダリングさせる。
一実施形態では、第1の画像フレーム部分および第2の画像フレーム部分は、ソース画像のセット内のソースピクセルによって表される画像コンテンツに基づいて、特定の画像フレーム内に描写される。
一実施形態では、第1の画像フレーム部分および第2の画像フレーム部分は、第1の画像フレーム部分および第2の画像フレーム部分における画像コンテンツの視覚的特徴差に基づいて、特定の画像フレーム内に描写される。
一実施形態では、1つまたは複数のコンテンツ光レベルは、複数の画像フレーム間の最大フレーム平均コンテンツ光レベル、複数の画像フレーム間の最大コンテンツ光レベルなどのうちの少なくとも1つを含む。
一実施形態では、第1の画像フレーム部分および第2の画像フレーム部分は、特定の画像フレームにおいて重なり合わない。
一実施形態では、画像ビットストリームはH.264ビデオ信号を表す。
一実施形態では、1つまたは複数のコンテンツ光レベルに基づく1つまたは複数の画像処理動作は、符号化ビデオシーケンス内の画像フレームの適切なサブセットのみに適用される。
一実施形態では、符号化ビデオシーケンス内の画像フレームの第2の適切なサブセットは、1つまたは複数のコンテンツ光レベルと同じタイプの異なるコンテンツ光レベルに基づいて、異なる画像処理動作で適用される。
一実施形態では、画像フレームの第1の適切なサブセットは共通の依存性識別子を共有する。
一実施形態では、画像フレームの第1の適切なサブセットは共通の品質識別子を共有する。
一実施形態では、画像フレームの第1の適切なサブセットは共通の時間的識別子を共有する。
一実施形態では、画像フレームの第1の適切なサブセットは、共通ビュー識別子、共通依存性識別子、共通品質識別子などの2つ以上を共有する。
一実施形態では、1つまたは複数のコンテンツ光レベルは1つまたは複数の補足エンハンスメント情報(SEI)メッセージ内に存在する。
一実施形態では、1つまたは複数のSEIメッセージ内のSEIメッセージは、IDRフレームで符号化された瞬時復号リフレッシュ(IDR)アクセスユニット内に存在する。
図4Dは、本発明の一実施形態による例示的なプロセスフローを示す。いくつかの実施形態では、1つまたは複数のコンピューティング装置またはコンポーネント(例えば、受信装置、セットトップボックス、スマートテレビ、ダウンストリームデコーダ、復号装置/モジュール、メディア装置/モジュールなど)がこのプロセスフローを実行することができる。
ブロック462において、画像処理装置(例えば、復号ブロック(130)など)は、符号化ビデオシーケンスを含む画像ビットストリームを、複数の画像フレーム、および1つまたは複数の第1のコンテンツ光レベルおよび1つまたは複数の第2のコンテンツ光レベルを含む画像メタデータに復号する。複数の画像フレーム内の各画像フレームは、複数のフレームインターバル内のそれぞれのフレームインターバルについてレンダリングされる。複数の画像フレーム内の各画像フレームは、完全にインターリーブされていない画像フレームタイプ、完全にインターリーブされた画像フレームタイプ、部分的にインターリーブされておらず部分的にインターリーブされた画像フレームタイプなどを含む複数の画像フレームタイプのうちの1つの画像フレームタイプである。1つまたは複数の第1のコンテンツ光レベルは、画像フレームの第1の適切なサブセット内の第1の画像フレームタイプの第1の画像フレームのピクセルに少なくとも部分的に基づいて、符号化ビデオシーケンス内の画像フレームの第1の適切なサブセットについて生成される。1つまたは複数の第2のコンテンツ光レベルは、第1の出力画像タイプとは異なる第2の画像フレームタイプの第2の画像フレームのピクセルに少なくとも部分的に基づいて、符号化ビデオシーケンス内の画像フレームの第2の適切なサブセットについて生成される。画像フレームの第2の適切なサブセットは、第2の画像フレームを含む。画像フレームの第1の適切なサブセットは、画像フレームの第2の適切なサブセットと共通の画像フレームを共有しない。
ブロック464では、1つまたは複数の第1のコンテンツ光レベルに少なくとも部分的に基づいて、画像処理装置は、画像フレームの第1の適切なサブセットについて1つまたは複数の第1の画像処理動作を実行して、ターゲット表示装置のために最適化された表示画像の第1のサブセットを生成する。
ブロック466において、画像処理装置は、表示画像の第1のサブセットをターゲット表示装置上にレンダリングさせる。
ブロック468において、1つまたは複数の第2のコンテンツ光レベルに少なくとも部分的に基づいて、画像処理装置は、画像フレームの第2の適切なサブセットについて1つまたは複数の第2の異なる画像処理動作を実行して、ターゲット表示装置のために最適化された表示画像の第2のサブセットを生成する。
ブロック470において、画像処理装置は、表示画像の第2のサブセットをターゲット表示装置上にレンダリングさせる。
一実施形態では、画像フレームの第1の適切なサブセットは第1の画像フレームタイプの画像フレームを含み、画像フレームの第2の適切なサブセットは第2の異なる画像フレームタイプの画像フレームを含む。
一実施形態では、1つまたは複数の第1のコンテンツ光レベルのそれぞれは画像処理動作において画像フレームの第1の適切なサブセット内のすべての画像フレームに適用され、1つまたは複数の第2のコンテンツ光レベルのそれぞれは画像処理動作において画像フレームの第2の適切なサブセット内のすべての画像フレームに適用される。
一実施形態では、1つまたは複数の第1のコンテンツ光レベルは、画像フレームの第1の適切なサブセット内の少なくとも1つの画像フレームのための第1の補足エンハンスメント情報(SEI)メッセージ内に存在し、1つまたは複数の第2のコンテンツ光レベルは、画像フレームの第2の適切なサブセット内の少なくとも1つの画像フレームのための第2のSEIメッセージ内に存在する。
図4Eは、本発明の一実施形態による例示的なプロセスフローを示す。いくつかの実施形態では、1つまたは複数のコンピューティング装置またはコンポーネント(例えば、アップストリームエンコーダ、符号化装置/モジュール、トランスコーディング装置/モジュール、復号装置/モジュール、逆トーンマッピング装置/モジュール、トーンマッピング装置/モジュール、メディア装置/モジュールなど)がこのプロセスフローを実行し得る。
ブロック482において、画像処理装置(例えば、符号化ブロック(120)など)は、複数の画像フレームについて1つまたは複数のコンテンツ光レベルを生成する。
ブロック484において、画像処理装置は、1つまたは複数のコンテンツ光レベルのための1つまたは複数の関連フィールドを生成する。1つまたは複数の関連フィールドは、1つまたは複数のコンテンツ光レベルのうちの1つのタイプ、1つまたは複数のコンテンツ光レベルのうちの1つの解釈、1つまたは複数のコンテンツ光レベルのうちの1つの入力/出力タイプなどのうちの少なくとも1つを含む。
ブロック486において、画像処理装置は、1つまたは複数のコンテンツ光レベルおよび1つまたは複数の関連フィールドを含む画像メタデータと共に、複数の画像フレームを画像ビットストリーム内に符号化して送信する。
図4Fは、本発明の一実施形態による例示的なプロセスフローを示す。いくつかの実施形態では、1つまたは複数のコンピューティング装置またはコンポーネント(例えば、受信装置、セットトップボックス、スマートテレビ、ダウンストリームデコーダ、復号装置/モジュール、メディア装置/モジュールなど)がこのプロセスフローを実行することができる。
ブロック492において、画像処理装置(例えば、復号ブロック(130)など)は、画像ビットストリームを複数の画像フレームと、1つまたは複数のコンテンツ光レベルおよび1つまたは複数の関連フィールドを含む画像メタデータとに復号する。1つまたは複数の関連フィールドは、1つまたは複数のコンテンツ光レベルのうちの1つのタイプ、1つまたは複数のコンテンツ光レベルのうちの1つの解釈、1つまたは複数のコンテンツ光レベルのうちの1つの入力/出力タイプなどのうちの少なくとも1つを含む。
ブロック494で、1つまたは複数のコンテンツ光レベルおよび1つまたは複数の関連フィールドに少なくとも部分的に基づいて、画像処理装置は、複数の画像フレームについて1つまたは複数の画像処理動作を実行して、ターゲット表示装置に最適化された表示画像を生成する。
ブロック496において、画像処理装置は、最適化された表示画像をターゲット表示装置上にレンダリングさせる。
図4Gは、本発明の一実施形態による例示的なプロセスフローを示す。いくつかの実施形態では、1つまたは複数のコンピューティング装置またはコンポーネント(例えば、受信装置、セットトップボックス、スマートテレビ、ダウンストリームデコーダ、復号装置/モジュール、メディア装置/モジュールなど)がこのプロセスフローを実行することができる。
ブロック412において、画像処理装置(例えば、復号ブロック(130)など)は、コンテンツスキャン適応メタデータの関連するセットを有する画像ビットストリーム内の符号化ビデオシーケンスを受信する。
ブロック414において、画像処理装置は、コンテンツスキャン適応メタデータのセットがビットストリームで受信されたかどうかを確認する。コンテンツスキャン適応メタデータのセットは、符号化ビデオシーケンスのフレームについてのすべての個々のサンプルの中の最大光レベルの上限を示す最大コンテンツ光レベルパラメータ、および符号化ビデオシーケンスの個々のフレームについてのサンプルの中の最大平均光レベルの上限を示す最大フレーム平均光レベルパラメータなどを含む。最大コンテンツ光レベルパラメータおよび最大フレーム平均光レベルパラメータは両方とも、符号化ビデオシーケンスのフレームのスキャンタイプに依存し、スキャンタイプは、プログレッシブフレームタイプ、相補フィールドペアタイプ、マクロブロック適応フレームフィールドフレームタイプ、個別フィールドピクチャタイプなどのうちの少なくとも1つである。
一実施形態では、スキャンタイプは、マクロブロック適応フレームフィールドフレームタイプであり、フィールドまたはフレームコーディングは個々のマクロブロックについて識別される。
一実施形態では、ビットストリーム内のコンテンツ光レベルタイプパラメータは、最大コンテンツ光レベルパラメータに関連するスキャンタイプを示す。
一実施形態では、コンテンツ光レベルタイプパラメータは、ルックアップテーブルのための少なくとも3ビットの符号なし整数インデックスである。
一実施形態では、ビットストリーム内の最大フレーム平均光レベルタイプパラメータは、最大フレーム平均光レベルパラメータに関連するスキャンタイプを示す。
一実施形態では、最大フレーム平均光レベルタイプパラメータは、ルックアップテーブルのための少なくとも3ビットの符号なし整数インデックスである。
一実施形態では、ビットストリーム内のコンテンツ光レベル入出力タイプパラメータは、最大コンテンツ光レベルパラメータに関連する入出力フォーマットを示す。
一実施形態では、コンテンツ光レベル入出力タイプパラメータは、ルックアップテーブルのための少なくとも3ビットの符号なし整数インデックスである。
一実施形態では、コンテンツ光レベル入出力タイプパラメータは、入力ソースタイプ、符号化ビデオシーケンスタイプ全体、およびライブ符号化タイプのうちの少なくとも1つを示す。
一実施形態では、ビットストリーム内の最大フレーム平均光レベル入出力タイプパラメータは、最大フレーム平均光レベルパラメータに関連する入出力フォーマットを示す。
一実施形態では、最大フレーム平均光レベル入出力タイプパラメータは、ルックアップテーブルのための少なくとも3ビットの符号なし整数インデックスである。
一実施形態では、最大フレーム平均光レベル入出力タイプパラメータは、入力ソースタイプ、符号化ビデオシーケンスタイプ全体、ライブ符号化タイプなどのうちの少なくとも1つを示す。
一実施形態では、ビットストリーム内の最大コンテンツ光レベル解釈パラメータは、最大コンテンツ光レベルパラメータがCEA規格861.3に従って計算されたMaxCLLパラメータであることを示す。
一実施形態では、ビットストリーム内の最大フレーム平均光レベル解釈パラメータは、最大コンテンツ光レベルパラメータがCEA規格861.3に従って計算されたMaxFALLパラメータであることを示す。
一実施形態では、画像処理装置は、コンテンツスキャン適応メタデータのセットが受信されたと判定したことに応答して、コンテンツスキャン適応メタデータのセットに従って色管理アルゴリズムパラメータを計算するようにさらに構成される。
一実施形態では、最大コンテンツ光レベルパラメータおよび最大フレーム平均光レベルパラメータは、共に16ビットの符号なし整数である。
図4Hは、本発明の一実施形態による例示的なプロセスフローを示す。いくつかの実施形態では、1つまたは複数のコンピューティング装置またはコンポーネント(例えば、アップストリームエンコーダ、符号化装置/モジュール、トランスコーディング装置/モジュール、復号装置/モジュール、逆トーンマッピング装置/モジュール、トーンマッピング装置/モジュール、メディア装置/モジュールなど)がこのプロセスフローを実行し得る。
ブロック432において、画像処理装置(例えば、符号化ブロック(120)など)は、ビットストリームに含まれるべき、符号化ビデオシーケンスのためのコンテンツスキャン適応メタデータのセットを生成する。コンテンツスキャン適応メタデータのセットは、符号化ビデオシーケンスのフレームについてのすべての個々のサンプルの中の最大光レベルの上限を示す最大コンテンツ光レベルパラメータ、および符号化ビデオシーケンスの個々のフレームについてのサンプルの中の最大平均光レベルの上限を示す最大フレーム平均光レベルパラメータとなどを含む。最大コンテンツ光レベルパラメータおよび最大フレーム平均光レベルパラメータは、共に符号化ビデオシーケンスのフレームのスキャンタイプに依存し、スキャンタイプは、プログレッシブフレームタイプ、相補フィールドペアタイプ、マクロブロック適応フレームフィールドフレームタイプ、個別フィールドピクチャタイプなどのうちの少なくとも1つである。
ブロック434で、画像処理装置は、コンテンツスキャン適応メタデータのセットと共に、ビットストリーム内の符号化ビデオシーケンスを送信する。
一実施形態では、表示装置、モバイル装置、セットトップボックス、マルチメディア装置などのコンピューティング装置は、前述の方法のいずれかを実行するように構成される。一実施形態では、装置はプロセッサを含み、前述の方法のいずれかを実行するように構成される。一実施形態では、非一時的なコンピュータ可読記憶媒体は、1つまたは複数のプロセッサによって実行されると、前述の方法のいずれかの性能を引き起こすソフトウェア命令を記憶する。
一実施形態では、コンピューティング装置は、1つまたは複数のプロセッサ、および1つまたは複数のプロセッサによって実行されると、前述の方法のいずれかの性能を引き起こす命令のセットを記憶する1つまたは複数の記憶媒体を備える。
本明細書では別個の実施形態について議論するが、本明細書で議論する実施形態および/または部分的な実施形態の任意の組み合わせを組み合わせて、さらなる実施形態を形成することができることに留意されたい。
コンピュータシステム実装例
本発明の実施形態は、コンピュータシステム、電子回路およびコンポーネントで構成されたシステム、マイクロコントローラなどの集積回路(IC)装置、フィールドプログラマブルゲートアレイ(FPGA)、または別の構成可能またはプログラマブル論理装置(PLD)、離散時間またはデジタル信号プロセッサ(DSP)、特定用途向けIC(ASIC)、および/またはそのようなシステム、装置、またはコンポーネントのうちの1つまたは複数を含む装置で実装され得る。コンピュータおよび/またはICは、本明細書で説明されるような、ダイナミックレンジが強化された画像の適応知覚量子化に関する命令を実行、制御、または実行することができる。コンピュータおよび/またはICは、本明細書に記載される適応知覚量子化プロセスに関連する様々なパラメータまたは値のいずれかを計算してもよい。画像およびビデオの実施形態は、ハードウェア、ソフトウェア、ファームウェア、およびそれらの様々な組合せで実施することができる。
本発明のある特定の実施形態は、プロセッサに本発明の方法を実行させるソフトウェア命令を実行するコンピュータプロセッサを含む。例えば、ディスプレイ、エンコーダ、セットトップボックス、トランスコーダなどの1つまたは複数のプロセッサは、プロセッサにアクセス可能なプログラムメモリ内のソフトウェア命令を実行することによって、上述のようなHDR画像の適応知覚量子化に関連する方法を実装することができる。本発明はまた、プログラム製品の形態で提供されてもよい。プログラム製品は、データプロセッサによって実行されると、データプロセッサに本発明の方法を実行させる命令を含むコンピュータ可読信号のセットを搬送する任意の非一時的な媒体を含むことができる。本発明によるプログラム製品は、多種多様な形態のいずれであってもよい。プログラム製品は、例えば、フロッピーディスケット、ハードディスクドライブを含む磁気データ記憶媒体、CD ROM、DVDを含む光データ記憶媒体、ROM、フラッシュRAMなどを含む電子データ記憶媒体などの物理媒体を含むことができる。プログラム製品上のコンピュータ可読信号は、オプションとして、圧縮または暗号化することができる。
構成要素(例えば、ソフトウェアモジュール、プロセッサ、アセンブリ、装置、回路など)が上記で言及されている場合、別段の指示がない限り、その構成要素への言及(「手段」への言及を含む)は、本発明の例示的な実施形態において機能を実行する開示された構造と構造的に同等でない構成要素を含む、説明された構成要素(例えば、機能的に同等)の機能を実行する任意の構成要素の同等物を含むものとして解釈されるべきである。
一実施形態によれば、本明細書で説明する技法は、1つまたは複数の特殊目的のコンピューティング装置によって実装される。特殊目的のコンピューティング装置は、技法を実行するためにハードワイヤードであってもよく、または技法を実行するように永続的にプログラムされた1つまたは複数の特定用途向け集積回路(ASIC)またはフィールドプログラマブルゲートアレイ(FPGA)などのデジタル電子装置を含んでもよく、あるいはファームウェア、メモリ、他のストレージ、またはそれらの組合せ内のプログラム命令に従って技法を実行するようにプログラムされた1つまたは複数の汎用ハードウェアプロセッサを含んでもよい。このような特殊目的のコンピューティング装置は、カスタムハードワイヤードロジック、ASIC、またはFPGAをカスタム・プログラミングと組み合わせて、技術を達成することもできる。特殊目的のコンピューティング装置は、デスクトップコンピュータシステム、ポータブルコンピュータシステム、ハンドヘルド装置、ネットワーキング装置、または技術を実現するためにハードワイヤードおよび/またはプログラムロジックを組み込んだその他の装置であってもよい。
例えば、図5は、本発明の実施形態を実施することができるコンピュータシステム500を示すブロック図である。コンピュータシステム500は、情報を通信するためのバス502または他の通信メカニズムと、情報を処理するためのバス502と結合されたハードウェアプロセッサ504とを含む。ハードウェアプロセッサ504は、例えば、汎用マイクロプロセッサであってもよい。
コンピュータシステム500は、また、プロセッサ504によって実行される情報および命令を記憶するためにバス502に結合されたランダムアクセスメモリ(RAM)または他のダイナミック記憶装置などのメインメモリ506を含む。メインメモリ506はまた、プロセッサ504によって実行される命令の実行中に、一時変数または他の中間情報を記憶するために使用されてもよい。このような命令は、プロセッサ504にアクセス可能な非一時的な記憶媒体に記憶されると、コンピュータシステム500を、命令で指定された動作を実行するようにカスタマイズされた特殊目的の装置にレンダリングする。
コンピュータシステム500は、さらに、バス502に結合された読取り専用メモリ(ROM)508または他の静的記憶装置を含み、静的情報およびプロセッサ504のための命令を記憶する。磁気ディスクまたは光ディスクなどの記憶装置510が提供され、情報および命令を記憶するためにバス502に結合される。
コンピュータシステム500は、コンピュータユーザに情報を表示するために、バス502を介して液晶ディスプレイなどのディスプレイ512に結合することができる。英数字および他のキーを含む入力装置514は、情報およびコマンド選択をプロセッサ504に通信するためにバス502に結合される。別のタイプのユーザ入力装置は、プロセッサ504に方向情報およびコマンド選択を通信し、ディスプレイ512上のカーソル移動を制御するための、マウス、トラックボール、またはカーソル方向キーなどのカーソル制御516である。この入力装置は、通常、装置が平面内の位置を指定することを可能にする第1の軸(例えば、x)および第2の軸(例えば、y)の2つの軸における2つの自由度を有する。
コンピュータシステム500は、カスタマイズされたハードワイヤードロジック、1つまたは複数のASICまたはFPGA、ファームウェアおよび/またはプログラムロジックを使用して、本明細書に記載する技術を実施することができ、これらをコンピュータシステムと組み合わせて、コンピュータシステム500を特殊目的の装置にするまたはプログラムする。一実施形態によれば、本明細書で説明する技法は、プロセッサ504がメインメモリ506に含まれる1つまたは複数の命令の1つまたは複数のシーケンスを実行することに応答して、コンピュータシステム500によって実行される。このような命令は、記憶装置510のような別の記憶媒体からメインメモリ506に読み込まれてもよい。メインメモリ506に含まれる命令のシーケンスを実行することにより、プロセッサ504は、本明細書に記載するプロセスステップを実行する。代替の実施形態では、ソフトウェア命令の代わりに、またはソフトウェア命令と組み合わせて、ハードワイヤード回路を使用することができる。
本明細書で使用される「記憶媒体」という用語は、機械を特定の方式で動作させるデータおよび/または命令を記憶する任意の非一時的な媒体を指す。そのような記憶媒体は、不揮発性媒体および/または揮発性媒体を含むことができる。不揮発性媒体は、例えば、記憶装置510のような光または磁気ディスクを含む。揮発性媒体は、メインメモリ506のようなダイナミックメモリを含む。記憶媒体の一般的な形態としては、例えば、フロッピーディスク、フレキシブルディスク、ハードディスク、ソリッドステートドライブ、磁気テープ、または他の任意の磁気データ記憶媒体、CD-ROM、他の任意の光データ記憶媒体、穴のパターンを有する任意の物理媒体、RAM、PROM、およびEPROM、FLASH(登録商標)-EPROM、NVRAM、他の任意のメモリチップまたはカートリッジが挙げられる。
記憶媒体は伝送媒体とは異なるが、伝送媒体と併せて使用することができる。伝送媒体は、記憶媒体間の情報転送に関与する。例えば、伝送媒体は、バス502を構成するワイヤを含む同軸ケーブル、銅線および光ファイバを含む。伝送媒体は、また、ラジオ波および赤外線データ通信中に生成されるような音波または光波の形態をとることができる。
様々な形態の媒体が、実行のために1つまたは複数の命令の1つまたは複数のシーケンスをプロセッサ504に搬送することに関与し得る。例えば、命令は最初に、リモートコンピュータの磁気ディスクまたはソリッドステートドライブ上で搬送されてもよい。遠隔コンピュータは、そのダイナミックメモリに命令をロードし、モデムを使用して電話回線を介して命令を送ることができる。コンピュータシステム500にローカルなモデムは、電話回線上でデータを受信し、赤外線送信機を使用してデータを赤外線信号に変換することができる。赤外線検出器は、赤外線信号において搬送されるデータを受信することができ、適切な回路は、データをバス502上に配置することができる。バス502は、データをメインメモリ506に搬送し、そこからプロセッサ504が命令を検索して実行する。メインメモリ506によって受信された命令は、プロセッサ504による実行の前または後のいずれかで、オプションとして記憶装置510に記憶することができる。
コンピュータシステム500は、また、バス502に結合された通信インタフェース518も含む。通信インタフェース518は、ローカルネットワーク522に接続されているネットワークリンク520への双方向データ通信結合を提供する。例えば、通信インタフェース518は、統合サービスデジタルネットワーク(ISDN)カード、ケーブルモデム、衛星モデム、またはモデムであり、対応するタイプの電話回線へのデータ通信接続を提供することができる。別の例として、通信インタフェース518は、互換性のあるLANへのデータ通信接続を提供するためのローカルエリアネットワーク(LAN)カードであってもよい。無線リンクを実装することも可能である。任意のそのような実装形態では、通信インタフェース518は、様々なタイプの情報を表すデジタルデータストリームを搬送する電気信号、電磁信号、または光信号を送受信する。
ネットワークリンク520は、典型的には、1つまたは複数のネットワークを介して他のデータ装置にデータ通信を提供する。例えば、ネットワークリンク520は、ローカルネットワーク522を介して、ホストコンピュータ524またはインターネットサービスプロバイダ(ISP)526によって操作されるデータ装置への接続を提供することができる。ISP 526は次に、現在一般に「インターネット」528と呼ばれているワールドワイドパケットデータ通信ネットワークを介してデータ通信サービスを提供する。ローカルネットワーク522およびインターネット528は共に、デジタルデータストリームを搬送する電気信号、電磁信号、または光信号を使用する。コンピュータシステム500との間でデジタルデータを搬送する、様々なネットワークを介する信号、ならびにネットワークリンク520上の信号、および通信インタフェース518を介する信号は、伝送媒体の例示的な形態である。
コンピュータシステム500は、ネットワーク、ネットワークリンク520および通信インタフェース518を介して、メッセージを送信し、プログラムコードを含むデータを受信することができる。インターネットの例では、サーバ530は、インターネット528、ISP526、ローカルネットワーク522および通信インタフェース518を介して、アプリケーションプログラムの要求されたコードを送信することができる。
受信されたコードは、受信されたときにプロセッサ504によって実行され、および/または、記憶装置510、または後に実行するための他の不揮発性記憶装置に記憶されてもよい。
等価物、拡張物、代替物およびその他
先述の明細書では、実装ごとに異なる可能性のある多数の具体的詳細を参照して、本発明の実施形態を説明してきた。したがって、本発明が何であり、出願人によって本発明であることが意図されているかの唯一の排他的なインジケータは、後続の補正を含むそのようなクレームが発行される特定の形態で、本出願から発行されるクレームのセットである。当該クレームに含まれる用語につきここに明示的に記載される定義は、クレームで使用される用語の意味に優先する。したがって、クレームに明示的に記載されていない限定、要素、特性、特徴、利点または属性は、当該クレームの範囲をいかなる方法でも制限すべきではない。したがって、本明細書および図面は、制限的な意味ではなく例示的な意味に考えられるべきである。
列挙された例示的な実施形態
本発明は、本発明のいくつかの部分の構造、特徴、および機能性を説明する以下の列挙された実施例(EEEs)を含むが、これらに限定されない、本明細書に記載された形態のいずれかで具現化されてもよい。
EEE1.ビデオデータを用いてコンテンツ光レベル情報を符号化する方法であって、前記方法は、
ソース画像のセット内のソースピクセルからピクセルが生成される特定の画像フレームについて、特定の画像フレーム内の第1の画像フレーム部分と、特定の画像フレーム内の第2の画像フレーム部分とを決定することであって、特定の画像フレームは、表示装置によってフレームインターバルについてレンダリングされる、決定することと、
ソース画像のセット内の第1の画像および第2の画像から、特定の画像フレーム内の第1の画像フレーム部分にインターリーブされる第1の画像フィールドおよび第2の画像フィールドをそれぞれ生成することであって、第1の画像フィールドはフレームインターバルの第1のフレームサブインターバルについてレンダリングされ、第2の画像フィールドはフレームインターバルの第2のフレームサブインターバルについてレンダリングされ、フレームインターバルの第2のフレームサブインターバルは、フレームインターバルの第1のフレームサブインターバルに後続する、生成することと、
ソース画像のセット内の第3の画像から、特定の画像フレーム内の第2の画像フレーム部分内のすべてのピクセル位置を占有するために使用される第3の画像フィールドを生成することと、
特定の画像フレーム内の第1の画像フィールド、第2の画像フィールド、および第3の画像フィールドのピクセルに少なくとも部分的に基づいて、特定の画像フレームを含む複数の画像フレームで符号化される符号化ビデオシーケンスのための1つまたは複数のコンテンツ光レベルを生成することと、
符号化ビデオシーケンスを、1つまたは複数のコンテンツ光レベルを含むコンテンツ光レベルメタデータと共に、画像ビットストリーム内に送信することと、を含む。
EEE2.第1の画像フレーム部分および第2の画像フレーム部分は、ソース画像のセット内のソースピクセルによって表される画像コンテンツに基づいて、特定の画像フレーム内に描写される、EEE1に記載の方法。
EEE3.第1の画像フレーム部分および第2の画像フレーム部分は、第1の画像フレーム部分および第2の画像フレーム部分における画像コンテンツの視覚的特徴差に基づいて、特定の画像フレーム内に描写される、EEE1に記載の方法。
EEE4.1つまたは複数のコンテンツ光レベルは、複数の画像フレーム間の最大フレーム平均コンテンツ光レベル、または複数の画像フレーム間の最大コンテンツ光レベルのうちの少なくとも1つを含む、EEE1に記載の方法。
EEE5.1つまたは複数のコンテンツ光レベルが1つまたは複数の関連するフィールドを有する画像ビットストリーム内で搬送され、1つまたは複数の関連するフィールドが最大コンテンツ光レベルの解釈、最大コンテンツ光レベルのタイプ、最大コンテンツ光レベルの入出力タイプ、最大フレーム平均光レベルの解釈、最大フレーム平均光レベルのタイプ、または最大フレーム平均光レベルの入出力タイプのうちの1つまたは複数を含む、EEE4に記載の方法。
EEE6.第1の画像フレーム部分および第2の画像フレーム部分は特定の画像フレームにおいて重複しない、EEE1に記載の方法。
EEE7.画像ビットストリームは、H.264ビデオ信号を表す、EEE1に記載の方法。
EEE8.画像フレームは、モノクロビデオコンテンツのための輝度サンプルのアレイで表現可能である、EEE1に記載の方法。
EEE9.画像フレームは、輝度サンプルのアレイと、多色ビデオコンテンツのためのカラーフォーマットにおけるクロマサンプルの2つの対応するアレイとを用いて表現可能である、EEE1に記載の方法。
EEE10.第1の画像フレーム部分および第2の画像フレーム部分は、特定の画像フレーム内に表される画像コンテンツ内の視覚的に関連する領域を集合的に表す、EEE1に記載の方法。
EEE11.特定の画像フレームは部分的にインターリーブされて部分的にインターリーブされていない画像フレームタイプであり、符号化ビデオシーケンスは、完全にインターリーブされた画像フレームタイプまたは完全にインターリーブされていない画像フレームタイプのうちの1つである第2の特定の画像フレームを含む、EEE1に記載の方法。
EEE12.符号化ビデオシーケンスは、部分的にインターリーブされて部分的にインターリーブされていない画像フレームタイプの画像フレームのみを含む、EEE1に記載の方法。
EEE13.1つまたは複数のコンテンツ光レベルの各々は、画像処理動作において、符号化ビデオシーケンス内のすべての画像フレームに適用される、EEE1に記載の方法。
EEE14.1つまたは複数のコンテンツ光レベルは、符号化ビデオシーケンス内の画像フレームの適切なサブセットのみに集合的に適用される、EEE1に記載の方法。
EEE15.符号化ビデオシーケンス内の画像フレームの第2の適切なサブセットは、1つまたは複数のコンテンツ光レベルと同じタイプの異なるコンテンツ光レベルに適用される、EEE14に記載の方法。
EEE16.画像フレームの第1の適切なサブセットは共通の依存性識別子を共有する、EEE14記載の方法。
EEE17.画像フレームの第1の適切なサブセットは、共通の品質識別子を共有する、EEE14に記載の方法。
EEE18.画像フレームの第1の適切なサブセットは、共通の時間識別子を共有する、EEE14に記載の方法。
EEE19.画像フレームの第1の適切なサブセットは、共通のビュー識別子、共通の依存性識別子、共通の品質識別子、または共通の時間識別子のうちの2つ以上を共有するEEE14記載の方法。
EEE20.1つまたは複数のコンテンツ光レベルが、1つまたは複数の補足エンハンスメント情報(SEI)メッセージ中に存在する、EEE1に記載の方法。
EEE21.1つまたは複数のSEIメッセージ内の1つのSEIメッセージは、瞬時復号リフレッシュ(IDR)フレームで符号化された瞬時復号リフレッシュ(IDR)アクセスユニット内に存在する、EEE20に記載の方法。
EEE22.第1の画像フレーム部分および第2の画像フレーム部分は、特定の画像フレーム内に表されるような画像コンテンツ内に存在するレターボックスを除外する、EEE1に記載の方法。
EEE23.ビデオデータを用いてコンテンツ光レベル情報を符号化する方法であって、前記方法は、
複数の画像フレームのための符号化ビデオシーケンスを生成することであって、複数の画像フレーム内の各画像フレームは複数のフレームインターバル内のそれぞれのフレームインターバルについて表示装置によってレンダリングされ、複数の画像フレーム内の各画像フレームは、完全にインターリーブされていない画像フレームタイプ、完全にインターリーブされた画像フレームタイプ、および部分的にインターリーブされていない画像フレームタイプを含む複数の画像フレームタイプのうちの1つの画像フレームタイプである、生成することと、
第1の画像フレームタイプの第1の画像フレームのピクセルに少なくとも部分的に基づいて、符号化ビデオシーケンス内の画像フレームの第1の適切なサブセットのための1つまたは複数の第1のコンテンツ光レベルを生成することであって、画像フレームの第1の適切なサブセットが第1の画像フレームを含む、生成することと、
第1の出力画像タイプとは異なる第2の画像フレームタイプの第2の画像フレームのピクセルに少なくとも部分的に基づいて、符号化ビデオシーケンス内の画像フレームの第2の適切なサブセットのための1つまたは複数の第2のコンテンツ光レベルを生成することであって、画像フレームの第2の適切なサブセットは第2の画像フレームを含み、画像フレームの第1の適切なサブセットは、画像フレームの第2の適切なサブセットと共通の画像フレームを共有しない、生成することと、
符号化ビデオシーケンスを、1つまたは複数の第1のコンテンツ光レベルおよび1つまたは複数の第2のコンテンツ光レベルを含む画像メタデータと共に、画像ビットストリーム内に送信することと、を含む。
EEE24.画像フレームの第1の適切なサブセットは第1の画像フレームタイプの画像フレームを含み、画像フレームの第2の適切なサブセットは、第2の異なる画像フレームタイプの画像フレームを含む、EEE23に記載の方法。
EEE25.1つまたは複数の第1のコンテンツ光レベルの各々は、画像処理動作において、画像フレームの第1の適切なサブセット内のすべての画像フレームに適用され、1つまたは複数の第2のコンテンツ光レベルの各々は、画像処理動作において、画像フレームの第2の適切なサブセット内のすべての画像フレームに適用される、EEE23に記載の方法。
EEE26.1つまたは複数の第1のコンテンツ光レベルは、画像フレームの第1の適切なサブセット内の少なくとも1つの画像フレームのための第1の補足エンハンスメント情報(SEI)メッセージ内に存在し、1つまたは複数の第2のコンテンツ光レベルは、画像フレームの第2の適切なサブセット内の少なくとも1つの画像フレームのための第2のSEIメッセージ内に存在する、EEE23に記載の方法。
EEE27.ビデオデータを用いてコンテンツ光レベル情報を復号する方法であって、前記方法は、
特定の画像フレームを含む複数の画像フレームで符号化された、符号化ビデオシーケンスを含む画像ビットストリームを、複数の画像フレーム、および符号化ビデオシーケンスのための1または複数のコンテンツ光レベルを含むコンテンツ光レベルメタデータへ復号することと、
符号化ビデオシーケンスのための1つまたは複数のコンテンツ光レベルに少なくとも部分的に基づいて、特定の画像フレームについて1つまたは複数の画像処理動作を実行して、ターゲット表示装置のために最適化された表示画像を生成することと、
最適化された表示画像がターゲット表示装置上にレンダリングされることと、を含み、
特定の画像フレームはソース画像のセット内のソースピクセルから生成されたピクセルを含み、フレームインターバルについてレンダリングされ、
符号化ビデオシーケンスのための1つまたは複数のコンテンツ光レベルは、特定の画像フレーム内の第1の画像フィールド、第2の画像フィールド、および第3の画像フィールドのピクセルに少なくとも部分的に基づいて生成され、
特定の画像フレーム内の第1の画像フレーム部分にインターリーブされる第1の画像フィールドおよび第2の画像フィールドは、ソース画像のセット内の第1の画像および第2の画像からそれぞれ生成され、
第1の画像フィールドはフレームインターバルの第1のフレームサブインターバルについてレンダリングされ、第2の画像フィールドはフレームインターバルの第2のフレームサブインターバルについてレンダリングされ、フレームインターバルの第2のフレームサブインターバルは、フレームインターバルの第1のフレームサブインターバルに後続し、
特定の画像フレーム内の第2の画像フレーム部分内のすべてのピクセル位置を占有するために使用される第3の画像フィールドは、ソース画像のセット内の第3の画像から生成される。
EEE28.第1の画像フレーム部分および第2の画像フレーム部分は、ソース画像のセット内のソースピクセルによって表される画像コンテンツに基づいて、特定の画像フレーム内に描写される、EEE27に記載の方法。
EEE29.第1の画像フレーム部分および前第2の画像フレーム部分は、第1の画像フレーム部分および第2の画像フレーム部分における画像コンテンツの視覚的特徴差に基づいて、特定の画像フレームにおいて描写される、EEE27に記載の方法。
EEE30.1つまたは複数のコンテンツ光レベルは、複数の画像フレーム間の最大フレーム平均コンテンツ光レベル、または複数の画像フレーム間の最大コンテンツ光レベルのうちの少なくとも1つを含む、EEE27に記載の方法。
EEE31.第1の画像フレーム部分および第2の画像フレーム部分は特定の画像フレームにおいて重複しない、EEE27に記載の方法。
EEE32.画像ビットストリームは、H.264ビデオ信号を表す、EEE27に記載の方法。
EEE33.1つまたは複数のコンテンツ光レベルに基づく1つまたは複数の画像処理動作は、符号化ビデオシーケンス内の画像フレームの適切なサブセットのみに適用される、EEE27に記載の方法。
EEE34.符号化ビデオシーケンス内の画像フレームの第2の適切なサブセットが、1つまたは複数のコンテンツ光レベルと同じタイプの異なるコンテンツ光レベルに基づいて、異なる画像処理動作で適用される、EEE33に記載の方法。
EEE35.画像フレームの第1の適切なサブセットが共通の依存性識別子を共有する、EEE33に記載の方法。
EEE36.画像フレームの第1の適切なサブセットは、共通の品質識別子を共有する、EEE33に記載の方法。
EEE37.画像フレームの第1の適切なサブセットは、共通の時間識別子を共有する、EEE33に記載の方法。
EEE38.画像フレームの第1の適切なサブセットが、共通のビュー識別子、共通の依存性識別子、共通の品質識別子、または共通の時間識別子のうちの2つ以上を共有するEEE33記載の方法。
EEE39.1つまたは複数のコンテンツ光レベルが、1つまたは複数の補足エンハンスメント情報(SEI)メッセージ中に存在する、EEE27に記載の方法。
EEE40.1つまたは複数のSEIメッセージ内の1つのSEIメッセージが、IDRフレームで符号化された瞬時復号リフレッシュ(IDR)アクセスユニット内に存在する、EEE39に記載の方法。
EEE41.ビデオデータを用いてコンテンツ光レベル情報を復号する方法であって、前記方法は、
符号化ビデオシーケンスを含む画像ビットストリームを、複数の画像フレームと、1つまたは複数の第1のコンテンツ光レベルおよび1つまたは複数の第2のコンテンツ光レベルを含む画像メタデータとに復号することと、
1つまたは複数の第1のコンテンツ光レベルに少なくとも部分的に基づいて、画像フレームの第1の適切なサブセットについて1つまたは複数の第1の画像処理動作を実行して、ターゲット表示装置のために最適化された表示画像の第1のサブセットを生成することと、
表示画像の第1のサブセットがターゲット表示装置上にレンダリングされるようにすることと、
1つまたは複数の第2のコンテンツ光レベルに少なくとも部分的に基づいて、画像フレームの第2の適切なサブセットについて1つまたは複数の第2の異なる画像処理動作を実行して、ターゲット表示装置のために最適化された表示画像の第2のサブセットを生成することと、
表示画像の2番目のサブセットがターゲット表示装置にレンダリングされるようにすることと、を含み、
複数の画像フレーム内の各画像フレームは複数のフレームインターバル内のそれぞれのフレームインターバルについてレンダリングされ、複数の画像フレーム内の各画像フレームは、完全にインターリーブされていない画像フレームタイプ、完全にインターリーブされた画像フレームタイプ、および部分的にインターリーブされていない画像フレームタイプを含む複数の画像フレームタイプのうちの1つの画像フレームタイプであり、
1つまたは複数の第1のコンテンツ光レベルは、画像フレームの第1の適切なサブセット内の第1の画像フレームタイプの第1の画像フレームのピクセルに少なくとも部分的に基づいて、符号化ビデオシーケンス内の画像フレームの第1の適切なサブセットについて生成され、
1つまたは複数の第2のコンテンツ光レベルは、第1の出力画像タイプとは異なる第2の画像フレームタイプの第2の画像フレームのピクセルに少なくとも部分的に基づいて、符号化ビデオシーケンス内の画像フレームの第2の適切なサブセットについて生成され、画像フレームの第2の適切なサブセットは第2の画像フレームを含み、画像フレームの第1の適切なサブセットは画像フレームの第2の適切なサブセットと共通の画像フレームを共有しない。
EEE42.画像フレームの第1の適切なサブセットは第1の画像フレームタイプの画像フレームを含み、画像フレームの第2の適切なサブセットは、第2の異なる画像フレームタイプの画像フレームを含む、EEE41に記載の方法。
EEE43.1つまたは複数の第1のコンテンツ光レベルの各々は、画像処理動作において、画像フレームの第1の適切なサブセット内のすべての画像フレームに適用され、1つまたは複数の第2のコンテンツ光レベルの各々は、画像処理動作において、画像フレームの第2の適切なサブセット内のすべての画像フレームに適用される、EEE41に記載の方法。
EEE44.1つまたは複数の第1のコンテンツ光レベルは、画像フレームの第1の適切なサブセット内の少なくとも1つの画像フレームのための第1の補足エンハンスメント情報(SEI)メッセージ内に存在し、1つまたは複数の第2のコンテンツ光レベルは、画像フレームの第2の適切なサブセット内の少なくとも1つの画像フレームのための第2のSEIメッセージ内に存在する、EEE41に記載の方法。
EEE45.ビデオデータを用いてコンテンツ光レベル情報を符号化する方法であって、前記方法は、
複数の画像フレームのための1つまたは複数のコンテンツ光レベルを生成することと、
1つまたは複数のコンテンツ光レベルのための1つまたは複数の関連フィールドを生成することであって、1つまたは複数の関連フィールドは、1つまたは複数のコンテンツ光レベルのうちの1つのためのタイプ、1つまたは複数のコンテンツ光レベルのうちの1つのための解釈、または1つまたは複数のコンテンツ光レベルのうちの1つのための入力/出力タイプのうちの少なくとも1つを含む、生成することと、
複数の画像フレームを、1つまたは複数のコンテンツ光レベルおよび1つまたは複数の関連フィールドを含む画像メタデータと共に、画像ビットストリーム内に符号化および送信することと、を含む。
EEE46.ビデオデータを用いてコンテンツ光レベル情報を復号する方法であって、前記方法は、
画像ビットストリームを、複数の画像フレーム、および1つまたは複数のコンテンツ光レベルと1つまたは複数の関連フィールドとを含む画像メタデータへ復号することと、
1つまたは複数のコンテンツ光レベルおよび1つまたは複数の関連フィールドに少なくとも部分的に基づいて、複数の画像フレームについて1つまたは複数の画像処理動作を実行して、ターゲット表示装置に最適化された表示画像を生成することと、
最適化された表示画像がターゲット表示装置上にレンダリングされることと、を含み、
1つまたは複数の関連フィールドは、1つまたは複数のコンテンツ光レベルのうちの1つに対するタイプ、1つまたは複数のコンテンツ光レベルのうちの1つに対する解釈、または1つまたは複数のコンテンツ光レベルのうちの1つに対する入力/出力タイプのうちの少なくとも1つを含む。
EEE47.EEE1~46に記載の方法のいずれか1つを実行するように構成されたコンピュータシステム。
EEE48.プロセッサを含み、EEE1~46に記載された方法のいずれか1つを実行するように構成された装置。
EEE49.EEE1~46のいずれかに記載の方法を実行するためのコンピュータ実行可能命令を記憶した非一時的なコンピュータ読み取り可能な記憶媒体。
EEE50.関連する光レベルメタデータのセットを用いて画像ビットストリームを処理するための方法であって、前記方法は、
ビットストリーム内の符号化ビデオシーケンスを受信することと、
光レベルメタデータのセットがビットストリームで受信されたかどうかを確認することと、を含み、
光レベルメタデータのセットは、符号化ビデオシーケンスのフレームに対するすべての個々のサンプルの中の光レベルを示す第1の光レベルパラメータ(例えば、最大、最小、5%フロア、95%シーリングなど)と、符号化ビデオシーケンスの個々のフレームに対するサンプルに関する第2の光レベルパラメータ(例えば、平均、中央値、および平均など)とを含み、
第1および第2の光レベルメタデータパラメータは、共に符号化ビデオシーケンスのフレームのスキャンタイプに依存し、スキャンタイプは、プログレッシブフレームタイプ、相補フィールドペアタイプ、マクロブロック適応フレームフィールドフレームタイプ、および個々のフィールドピクチャタイプのうちの1つである。
EEE51.第3のパラメータが、第1の光レベルパラメータ、第2の光レベルパラメータ、または第1および第2の光レベルパラメータの両方に関連する入出力フォーマットを示す、EEE50に記載の方法。
EEE52.ビットストリーム内のフラグは、第1の光レベルパラメータ、第2の光レベルパラメータ、または第1および第2の光レベルパラメータの両方が所定の方法(例えば、CEA規格861.3)に従って計算されることを示す、EEE50またはEEE51に記載の方法。

Claims (14)

  1. コンテンツスキャン適応メタデータの関連するセットを有する画像ビットストリームを処理するための方法であって、前記方法は、
    ビットストリーム内の符号化ビデオシーケンスを受信することと、
    前記コンテンツスキャン適応メタデータのセットが前記ビットストリーム内で受信されたかどうかを確認することと、を含み、
    前記コンテンツスキャン適応メタデータのセットは、
    前記符号化ビデオシーケンスのフレームについてのすべての個々のサンプルの中の最大光レベルの上限を示す最大コンテンツ光レベルパラメータと、
    前記符号化ビデオシーケンスの個々のフレームについてのサンプルの中の最大平均光レベルの上限を示す最大フレーム平均光レベルパラメータと、
    前記最大コンテンツ光レベルパラメータに関連付けられたスキャンタイプを示す、コンテンツ光レベルタイプパラメータと、
    前記最大フレーム平均光レベルパラメータに関連するスキャンタイプを示す、最大フレーム平均光レベルタイプパラメータと、
    前記最大コンテンツ光レベルパラメータに関連する、入力ビデオの入力フォーマットおよび復号された出力ビットストリームの出力フォーマットを示す、コンテンツ光レベル入出力タイプパラメータと、
    前記最大フレーム平均光レベルパラメータに関連する、入力ビデオの入力フォーマットおよび復号された出力ビットストリームの出力フォーマットを示す、最大フレーム平均光レベル入出力タイプパラメータと、を含み、
    前記最大コンテンツ光レベルパラメータおよび前記最大フレーム平均光レベルパラメータは、共に前記符号化ビデオシーケンスの前記フレームのスキャンタイプに依存し、前記スキャンタイプは、プログレッシブフレームタイプ、相補フィールドペアタイプ、マクロブロック適応フレームフィールドフレームタイプ、および個々のフィールドピクチャタイプのうちの少なくとも1つである、方法。
  2. 前記スキャンタイプは前記マクロブロック適応フレームフィールドフレームタイプであり、フィールドまたはフレームコーディングは、個々のマクロブロックについて識別される、請求項1に記載の方法。
  3. 前記コンテンツ光レベルタイプパラメータは、ルックアップテーブルのための少なくとも3ビットの符号なし整数インデックスである、請求項に記載の方法。
  4. 前記最大フレーム平均光レベルタイプパラメータは、ルックアップテーブルのための少なくとも3ビットの符号なし整数インデックスである、請求項に記載の方法。
  5. 前記コンテンツ光レベル入出力タイプパラメータは、ルックアップテーブルのための少なくとも3ビットの符号なし整数インデックスである、請求項に記載の方法。
  6. 前記コンテンツ光レベル入出力タイプパラメータは、前記最大コンテンツ光レベルパラメータが入力ソースに適用されることを識別する入出力タイプである、入力ソースタイプ、前記最大コンテンツ光レベルパラメータが全体符号化ビデオシーケンスに適用されることを識別する入出力タイプである、全体符号化ビデオシーケンスタイプ、およびライブで符号化されるコンテンツである、ライブ符号化タイプのうちの少なくとも1つを示す、請求項に記載の方法。
  7. 前記最大フレーム平均光レベル入出力タイプパラメータは、ルックアップテーブルのための少なくとも3ビットの符号なし整数インデックスである、請求項に記載の方法。
  8. 前記最大フレーム平均光レベル入出力タイプパラメータは、前記最大フレーム平均光レベルパラメータが入力ソースに適用されることを識別する入出力タイプである、入力ソースタイプ、前記最大フレーム平均光レベルパラメータが全体符号化ビデオシーケンスに適用されることを識別する入出力タイプである、全体符号化ビデオシーケンスタイプ、およびライブで符号化されるコンテンツである、ライブ符号化タイプのうちの少なくとも1つを示す、請求項に記載の方法。
  9. 前記ビットストリーム内の最大コンテンツ光レベル解釈パラメータは、前記最大コンテンツ光レベルパラメータがCEA規格861.3に従って計算されたMAXCLLパラメータであることを示す、請求項1に記載の方法。
  10. 前記ビットストリーム内の最大フレーム平均光レベル解釈パラメータは、前記最大コンテンツ光レベルパラメータがCEA規格861.3に従って計算されたMAXFALLパラメータであることを示す、請求項1に記載の方法。
  11. 前記コンテンツスキャン適応メタデータのセットが受信される場合、前記コンテンツスキャン適応メタデータのセットに従って色管理アルゴリズムパラメータを計算することをさらに含む、請求項1に記載の方法。
  12. 前記最大コンテンツ光レベルパラメータおよび前記最大フレーム平均光レベルパラメータは、共に16ビットの符号なし整数である、請求項1に記載の方法。
  13. 非一時的なコンピュータ可読メモリと、
    前記非一時的なコンピュータ可読メモリに記憶されたビットストリームと、
    前記非一時的なコンピュータ可読メモリに論理的に結合され、前記ビットストリームを処理するように構成されたプロセッサと、を備え、
    前記ビットストリームは、
    符号化ビデオシーケンスと、
    コンテンツスキャン適応メタデータのセットと、を備え、
    前記プロセッサは、前記コンテンツスキャン適応メタデータのセットが前記ビットストリーム内で受信されたかどうかを確認し、
    前記コンテンツスキャン適応メタデータのセットは、
    前記符号化ビデオシーケンスのフレームについてのすべての個々のサンプルの中の最大光レベルの上限を示す最大コンテンツ光レベルパラメータと、
    前記符号化ビデオシーケンスの個々のフレームについてのサンプルの中の最大平均光レベルの上限を示す最大フレーム平均光レベルパラメータと、
    前記最大コンテンツ光レベルパラメータに関連付けられたスキャンタイプを示す、コンテンツ光レベルタイプパラメータと、
    前記最大フレーム平均光レベルパラメータに関連するスキャンタイプを示す、最大フレーム平均光レベルタイプパラメータと、
    前記最大コンテンツ光レベルパラメータに関連する、入力ビデオの入力フォーマットおよび復号された出力ビットストリームの出力フォーマットを示す、コンテンツ光レベル入出力タイプパラメータと、
    前記最大フレーム平均光レベルパラメータに関連する、入力ビデオの入力フォーマットおよび復号された出力ビットストリームの出力フォーマットを示す、最大フレーム平均光レベル入出力タイプパラメータと、を含み、
    前記最大コンテンツ光レベルパラメータおよび前記最大フレーム平均光レベルパラメータは、共に前記符号化ビデオシーケンスの前記フレームのスキャンタイプに依存し、前記スキャンタイプは、プログレッシブフレームタイプ、相補フィールドペアタイプ、マクロブロック適応フレームフィールドフレームタイプ、および個々のフィールドピクチャタイプのうちの少なくとも1つである、ビデオ処理装置。
  14. コンテンツスキャン適応メタデータの関連するセットを有する画像ビットストリームを配信するための方法であって、前記方法は、
    前記ビットストリームに含まれるべき、符号化ビデオシーケンスのためのコンテンツスキャン適応メタデータのセットを生成することを含み、
    前記コンテンツスキャン適応メタデータのセットは、
    前記符号化ビデオシーケンスのフレームについてのすべての個々のサンプルの中の最大光レベルの上限を示す最大コンテンツ光レベルパラメータと、
    前記符号化ビデオシーケンスの個々のフレームについてのサンプルの中の最大平均光レベルの上限を示す最大フレーム平均光レベルパラメータと、
    前記最大コンテンツ光レベルパラメータに関連付けられたスキャンタイプを示す、コンテンツ光レベルタイプパラメータと、
    前記最大フレーム平均光レベルパラメータに関連するスキャンタイプを示す、最大フレーム平均光レベルタイプパラメータと、
    前記最大コンテンツ光レベルパラメータに関連する、入力ビデオの入力フォーマットおよび復号された出力ビットストリームの出力フォーマットを示す、コンテンツ光レベル入出力タイプパラメータと、
    前記最大フレーム平均光レベルパラメータに関連する、入力ビデオの入力フォーマットおよび復号された出力ビットストリームの出力フォーマットを示す、最大フレーム平均光レベル入出力タイプパラメータと、を含み、
    前記最大コンテンツ光レベルパラメータおよび前記最大フレーム平均光レベルパラメータは、共に前記符号化ビデオシーケンスの前記フレームのスキャンタイプに依存し、前記スキャンタイプは、プログレッシブフレームタイプ、相補フィールドペアタイプ、マクロブロック適応フレームフィールドフレームタイプ、および個々のフィールドピクチャタイプのうちの少なくとも1つであり、
    前記コンテンツスキャン適応メタデータのセットが前記ビットストリーム内で受信されたかどうかを確認されるように、前記コンテンツスキャン適応メタデータのセットを有する前記ビットストリーム内で前記符号化ビデオシーケンスを送信する、方法。
JP2020537620A 2018-01-11 2019-01-08 コンテンツスキャン適応メタデータを用いた光レベル管理 Active JP7027554B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201862616057P 2018-01-11 2018-01-11
US62/616,057 2018-01-11
PCT/US2019/012737 WO2019139912A2 (en) 2018-01-11 2019-01-08 Light level management with content scan adaptive metadata

Publications (2)

Publication Number Publication Date
JP2021508990A JP2021508990A (ja) 2021-03-11
JP7027554B2 true JP7027554B2 (ja) 2022-03-01

Family

ID=67218732

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2020537620A Active JP7027554B2 (ja) 2018-01-11 2019-01-08 コンテンツスキャン適応メタデータを用いた光レベル管理

Country Status (5)

Country Link
US (1) US10977779B2 (ja)
EP (1) EP3738095A4 (ja)
JP (1) JP7027554B2 (ja)
CN (1) CN111566694A (ja)
WO (1) WO2019139912A2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020061172A1 (en) * 2018-09-19 2020-03-26 Dolby Laboratories Licensing Corporation Automatic display management metadata generation for gaming and/or sdr+ contents
US11317137B2 (en) * 2020-06-18 2022-04-26 Disney Enterprises, Inc. Supplementing entertainment content with ambient lighting

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008252761A (ja) 2007-03-30 2008-10-16 Sony Corp 映像信号処理装置と映像信号処理方法

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003345293A (ja) * 2002-05-27 2003-12-03 Fujitsu Hitachi Plasma Display Ltd プラズマディスプレイパネルの駆動方法
CN101727868B (zh) * 2008-10-10 2011-12-21 华映视讯(吴江)有限公司 动态伽玛调整方法与其装置
TWI538473B (zh) * 2011-03-15 2016-06-11 杜比實驗室特許公司 影像資料轉換的方法與設備
EP2989793B1 (en) * 2013-11-13 2017-04-05 Dolby Laboratories Licensing Corporation Workflow for content creation and guided display management of enhanced dynamic range video
EP3013050A1 (en) * 2014-10-22 2016-04-27 Axis AB Video compression with adaptive GOP length and adaptive quantization
EP3051821A1 (en) 2015-01-30 2016-08-03 Thomson Licensing Method and apparatus for encoding and decoding high dynamic range (HDR) videos
JP6663214B2 (ja) * 2015-05-26 2020-03-11 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America 表示方法および表示装置
WO2017015397A1 (en) * 2015-07-22 2017-01-26 Dolby Laboratories Licensing Corporation Video coding and delivery with both spatial and dynamic range scalability
EP3439309B1 (en) * 2016-03-30 2020-12-09 LG Electronics Inc. -1- Method and apparatus for transmitting and receiving broadcast signals
US10834153B2 (en) * 2016-08-24 2020-11-10 Qualcomm Incorporated System level signaling of SEI tracks for media data streaming
EP3522514A4 (en) * 2016-09-28 2019-08-07 Panasonic Intellectual Property Management Co., Ltd. ADJUSTMENT DEVICE, ADJUSTMENT METHOD, AND PROGRAM
JP6808762B2 (ja) * 2019-01-07 2021-01-06 キヤノン株式会社 情報処理装置および情報処理方法
JP6921886B2 (ja) * 2019-03-19 2021-08-18 キヤノン株式会社 情報処理装置および情報処理方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008252761A (ja) 2007-03-30 2008-10-16 Sony Corp 映像信号処理装置と映像信号処理方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
Recommendation ITU-T H.265(12/2016),pp.301,309,367

Also Published As

Publication number Publication date
WO2019139912A2 (en) 2019-07-18
US10977779B2 (en) 2021-04-13
CN111566694A (zh) 2020-08-21
US20210049747A1 (en) 2021-02-18
WO2019139912A3 (en) 2020-04-30
EP3738095A2 (en) 2020-11-18
JP2021508990A (ja) 2021-03-11
EP3738095A4 (en) 2021-05-05

Similar Documents

Publication Publication Date Title
US10582177B2 (en) Playback method according to function of playback device
US9538155B2 (en) Decoding and display of high dynamic range video
US20230156148A1 (en) Conversion method and conversion apparatus
US8891863B2 (en) High dynamic range, backwards-compatible, digital cinema
US9277196B2 (en) Systems and methods for backward compatible high dynamic range/wide color gamut video coding and rendering
CN108353190B (zh) 用于生成视频数据的装置、方法和计算机可读存储媒体
JP5992997B2 (ja) 映像符号化信号を発生する方法及び装置
CN110675840B (zh) 显示装置及显示方法
JP2023099170A (ja) ソースカラーボリューム情報メッセージング
US7893999B2 (en) Simultaneous video and sub-frame metadata capture system
CN111771375B (zh) 用于处理多种hdr视频格式的系统
JP7027554B2 (ja) コンテンツスキャン適応メタデータを用いた光レベル管理
CN111133761B (zh) 利用图像元数据编码或解码视频数据的方法、装置和系统
WO2023150074A1 (en) Beta scale dynamic display mapping
François et al. High dynamic range and wide color gamut video standardization—Status and perspectives
Smith Ultra HD Blu-ray Format Video Characteristics
TW202147845A (zh) 運算用以編輯高動態範圍內容之動態後設資料

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200902

A871 Explanation of circumstances concerning accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A871

Effective date: 20200902

A975 Report on accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A971005

Effective date: 20201208

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20201215

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20210311

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210608

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20210706

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20211005

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220104

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20220118

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20220216

R150 Certificate of patent or registration of utility model

Ref document number: 7027554

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150