JP6390775B2 - 復号装置及び復号方法 - Google Patents

復号装置及び復号方法 Download PDF

Info

Publication number
JP6390775B2
JP6390775B2 JP2017176290A JP2017176290A JP6390775B2 JP 6390775 B2 JP6390775 B2 JP 6390775B2 JP 2017176290 A JP2017176290 A JP 2017176290A JP 2017176290 A JP2017176290 A JP 2017176290A JP 6390775 B2 JP6390775 B2 JP 6390775B2
Authority
JP
Japan
Prior art keywords
hrd
video
syntax
parameter
flag
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2017176290A
Other languages
English (en)
Other versions
JP2018023139A (ja
Inventor
ムンシ ハケ
ムンシ ハケ
佐藤 数史
数史 佐藤
アリ タバタバイ
アリ タバタバイ
鈴木 輝彦
輝彦 鈴木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Publication of JP2018023139A publication Critical patent/JP2018023139A/ja
Application granted granted Critical
Publication of JP6390775B2 publication Critical patent/JP6390775B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/152Data rate or code amount at the encoder output by measuring the fullness of the transmission buffer
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/187Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a scalable video layer
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/188Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a video data packet, e.g. a network abstraction layer [NAL] unit
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • H04N19/31Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability in the temporal domain
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/44Decoders specially adapted therefor, e.g. video decoders which are asymmetric with respect to the encoder
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/597Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding specially adapted for multi-view video sequence encoding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/184Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being bits, e.g. of the compressed video stream

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Description

(関連出願の相互参照)
本出願は、2013年2月1日出願の「時間レイヤを用いた映像符号化システム及びその動作方法(VIDEO CODING SYSTEM WITH TEMPORAL LAYER AND METHOD OF OPERATION THEREOF)」という名称の米国特許出願番号13/757,624に関連する主題を含む。この特許の主題内容全体は、引用により本明細書に組み込まれる。
本出願は、2013年2月1日出願の「低遅延を用いた映像符号化システム及びその動作方法(VIDEO CODING SYSTEM WITH LOW DELAY AND METHOD OF OPERATION THEREOF)」という名称の米国特許出願番号13/757,685に関連する主題を含む。この特許の主題内容全体は、引用により本明細書に組み込まれる。
本出願は、2012年7月2日出願の米国仮特許出願番号61/667,286、2012年7月30日出願の米国仮特許出願番号61/667,324、及び2013年2月1日出願の米国非仮特許出願番号13/757,679の優先権を主張するものであり、それらの主題内容全体は、引用により本明細書に組み込まれる。
(技術分野)
本発明は、概して映像システムに関し、より詳細には、時間スケーラビリティを用いた映像符号化に関するシステムに関する。
スマートフォン、高精細テレビジョン、自動車情報システム、及び画面を備える他のビデオデバイスへの高品質ビデオの展開は、近年、非常に発展している。ビデオコンテンツに対応している多種多様な情報デバイスは、種々の大きさ、品質、及び接続能力を備えるデバイスに多くの種類のビデオコンテンツを提供することを必要としている。
ビデオは、2次元単一視点ビデオから、高解像度3次元画像を有する多視点ビデオに展開している。ビデオをより効率的に伝送するために、種々の映像符号化及び圧縮方式により、最小限のデータ量から最適な画像を得ることが試行されている。動画像符号化専門家グループ(MPEG)が、規格化されたデータシーケンス及びアルゴリズムに基づく高品質ビデオを可能にする規格を開発した。H.264(MPEG4パート10)/アドバンストビデオコーディング設計では、従来のMPEG−2形式と比較して概して2倍の符号化効率の改良が行われた。ビデオ品質は、ビデオ内のデータの操作及び圧縮に依存している。使用される様々な帯域幅に適合するようにビデオを変更して、様々な解像度及び機能セットを有するディスプレイデバイスにビデオを送信することができる。しかしながら、より大型で高品質なビデオ、又はより複雑なビデオ機能を配信することには、帯域幅を追加すること及びビデオ圧縮を改良することが必要となる。
(発明が解決しようとする課題)
このように、様々な大きさ、解像度、及び接続性を有するデバイスの広い範囲にわたって高品質画像及び高度な画像機能を提供できる映像符号化システムに関する必要性が依然として残されている。範囲が拡大している高機能デバイスにビデオを提供する要求が増加していることを考慮すると、これらの課題に対する解決方法が見いだされることが増々重要になっている。商業上の競争圧力が常に高くなっていることを考慮すると、消費者の期待が高まっていること及び市場での有意な製品差別化の機会が減少していることと併せて、これらの課題に対する解決方法が見いだされることが重要になっている。追加的に、経費を節減し、効率性及び業績を高め、競争圧力に対処する必要性から、より一層緊急に、これらの課題に対する解決方法を見いだすことが重要で必要になっている。
これらの課題に対する解決方法は、長期にわたって探求されてきたが、従来の成果は、何らかの解決方法を教示又は提案するものではなく、従って、長い間当業者は、これらの課題に対する解決方法を避けてきた。
B. Bross、W. Han、J Ohm、G. Sullivan、T. Wieg著 「High−Efficiency Video Coding (HEVC) text specification draft 8」 JCTVC−J1003 d7 2012年7月(Stockholm) B. Bross、W. Han、J. Ohm、G. Sullivan、T. Wieg著 「High Efficiency Video Coding (HEVC) text specification draft 7」 JCTVC−I1003 d4 2012年5月(Geneva) M. Haque、K. Sato、A. Tabatabai、T. Suzuki著 「Simplification of HRD parameters for Temporal Scalability」 JCTVC−J0272 2012年7月(Stockholm) M. Haque、K. Sato、A. Tabatabai、T. Suzuki著 「HEVC VUI Parameters with Extension Hooks」 JCTVC−J0270 2012年7月(Stockholm) M. Haque、A. Tabatabai著 「Extension of HEVC VUI Syntax Structure」 JCTVC−I0263 2012年5月 M. Haque著 「AHG10: VUI and HRD syntax designs agreed by the BoG on VPS and NUH」 JCTVC−J0548rl 2012年7月
ある実施形態によれば、符号化ビットストリームのサブレイヤの符号化ピクチャバッファ(CPB)の最大入力ビットレート又はCPBサイズを、複数のサブレイヤに共通する仮想参照デコーダ(HRD)パラメータを含むHRD固定シンタックスに含まれる第1パラメータ及び各サブレイヤに固有のHRDパラメータを含むHRD可変シンタックスに含まれる第2パラメータにより特定して、上記サブレイヤを含む上記符号化ビットストリームを復号する復号部、を備える復号装置が提供される。
他の実施形態によれば、復号装置により実行される復号方法であって、符号化ビットストリームのサブレイヤの符号化ピクチャバッファ(CPB)の最大入力ビットレート又はCPBサイズを、複数のサブレイヤに共通する仮想参照デコーダ(HRD)パラメータを含むHRD固定シンタックスに含まれる第1パラメータ及び各サブレイヤに固有のHRDパラメータを含むHRD可変シンタックスに含まれる第2パラメータにより特定して、上記サブレイヤを含む上記符号化ビットストリームを復号すること、を含む復号方法もまた提供され得る。
本発明のいくつかの実施形態は、上記に説明した態様に加えて、又はそれらの代わりに別の態様を有する。当業者であれば、これらの態様は、添付図面を参照して以下の詳細な説明を読むことにより明らかとなるであろう。
本発明の一実施形態における映像符号化システムのブロック図である。 ビデオビットストリームの実施例である。 HEVC VUIスケーラブル拡張シンタックスの実施例である。 HRDシンタックスの実施例である。 HRD固定シンタックスの実施例である。 HRD可変シンタックスの実施例である。 第1のHEVC VUI拡張シンタックスの実施例である。 第2のHEVC VUI拡張シンタックスの実施例である。 HRDベースシンタックスの実施例である。 HRDサブレイヤシンタックスの実施例である。 HRD VUI シンタックスの実施例である。 映像符号化システムの機能ブロック図である。 映像符号化システムの制御フローである。 本発明の別の実施形態における映像符号化システムの動作方法のフローチャートである。
以下の実施形態は、当業者が本発明を実施及び利用することができるように十分詳細に説明される。本開示に基づいて別の実施形態が明らかになること、及び本発明の範囲から逸脱することなく処理又は機構の変更を行うことができるということを理解されたい。
以下の説明において、本発明を完全に理解できるように多くの具体的な詳細内容が提示される。しかしながら、本発明はこれらの具体的な詳細内容がなくとも実施できることは明らかである。本発明が不明瞭にならないように、一部の公知の回路、システム構成、及び処理ステップは、詳細に開示されていない。
同様に、システムの実施形態を示す図面は、概略的なものであり、縮尺通りではなく、特に、一部の寸法は、表現を明確にするためのものであり、図面内で誇張して示されている。例示、説明、及びその理解を明確及び容易にするために、いくつかの機能が共通する複数の実施形態を開示して説明するが、互いに類似した同様の特徴部は、通常、同様の参照符号を用いて説明する。
「シンタックス」という用語は、データ構造を表す一組の要素を意味する。本明細書で用いられる「モジュール」という用語は、使用される文脈により、本発明におけるソフトウェア、ハードウェア、又はそれらの組み合わせを含むことができる。
ここで図1を参照すると、本発明の一実施形態における映像符号化システム100のブロック図が示されている。ビデオエンコーダ102は、ビデオコンテンツ108を受信し、ビデオビットストリーム110を復号用のビデオデコーダ104に送信して、ディスプレイインタフェース120に表示することができる。
ビデオエンコーダ102は、ビデオコンテンツ108を受信及び符号化することができる。ビデオエンコーダ102は、ビデオコンテンツ108を種々の形式に符号化するためのユニットである。ビデオコンテンツ108は、対象物のシーンのデジタル表現として規定される。例えば、ビデオコンテンツ108は、1つ又はそれ以上のビデオカメラのデジタル出力とすることができる。
符号化は、ビデオコンテンツ108をコンピュータにより種々の形式に変更することとして規定される。例えば、符号化は、ビデオコンテンツ108をビデオビットストリーム110に圧縮して、ビデオビットストリーム110を送信するのに必要なデータ量を減少させることができる。
別の実施例では、ビデオコンテンツ108は、圧縮されることによって符号化されること、視覚的に強調されること、1つ又はそれ以上のビューに分割されること、解像度が変更されること、アスペクト比が変更されること、又はそれらの組み合わせが可能である。別の例示的な実施例では、ビデオコンテンツ108は、高効率映像符号化(HEVC)/H.265ドラフト規格により符号化することができる。
ビデオエンコーダ102は、ビデオコンテンツ108を符号化してビデオビットストリーム110を生成することができる。ビデオビットストリーム110は、ビデオコンテンツ108に関連する情報を表すビット列として規定される。ビデオビットストリーム110は、例えば、ビデオコンテンツ108の圧縮を表すビット列とすることができる。別の実施例では、ビデオビットストリーム110は、時間とともに連続的に送信されるビデオコンテンツ108を表す一連のビットである。
ビデオエンコーダ102は、シーンに関するビデオコンテンツ108を様々な方法で受け取ることができる。例えば、実在の対象物を表すビデオコンテンツ108は、ビデオカメラ、複数のカメラで撮影されること、コンピュータで生成されること、ファイルとして提供されること、又はそれらの組み合わせが可能である。
ビデオコンテンツ108は、様々なビデオ機能を含むことができる。例えば、ビデオコンテンツ108は、単一視点ビデオ、多視点ビデオ、立体的ビデオ、又はそれらの組み合わせを含むことができる。別の実施例では、ビデオコンテンツ108は、3D眼鏡を用いずに3次元(3D)ビデオ表示に対応するための4つ又はそれより多いカメラの多視点ビデオとすることができる。
ビデオエンコーダ102は、ビデオシンタックス114を使用してビデオコンテンツ108を符号化して、ビデオビットストリーム110を生成することができる。ビデオシンタックス114は、ビデオコンテンツ108を符号化及び復号するための符号化方法を表す一組の情報要素として規定される。ビデオビットストリーム110は、高効率映像符号化/H.265規格のようなビデオシンタックス114に準拠し、HEVCビデオビットストリーム、超高精細ビデオビットストリーム、又はそれらの組み合わせを含むことができる。ビデオビットストリーム110は、ビデオシンタックス114を含むことができる。
ビデオビットストリーム110は、ビデオコンテンツ108の画像、及びビデオコンテンツ108の符号化に関する関連制御情報を表す情報を含むことができる。例えば、ビデオビットストリーム110は、ビデオシンタックス114のオカレンス、及びビデオコンテンツ108のオカレンスを含むことができる。
映像符号化システム100は、ビデオビットストリーム110を復号するためのビデオデコーダ104を含むことができる。ビデオデコーダ104は、ビデオビットストリーム110を受信しビデオビットストリーム110を変更して、ビデオストリーム112を生成するためのユニットとして規定される。
ビデオデコーダ104は、ビデオビットストリーム110を復号し、ビデオシンタックス114を使用してビデオストリーム112を生成することができる。復号は、ビデオビットストリーム110をコンピュータにより変更してビデオストリーム112を生成することとして規定される。例えば、復号は、ビデオビットストリーム110を解凍して、ディスプレイインタフェース120に表示するための形式で構成されたビデオストリーム112を生成することができる。
ビデオストリーム112は、ビデオコンテンツ108のコンピュータにより変更されたバージョンとして規定される。例えば、ビデオストリーム112は、種々の解像度を有するビデオコンテンツ108の変更されたオカレンスを含むことができる。ビデオストリーム112は、ビデオコンテンツ108から切り取って復号されたピクチャを含むことができる。
別の実施例では、ビデオストリーム112は、ビデオコンテンツ108とは異なるアスペクト比、異なるフレームレート、異なる立体的ビュー、異なるビュー順序、又はそれらの組み合わせを有することができる。ビデオストリーム112は、種々の色パラメータ、色平面、コントラスト、色相、又はそれらの組み合わせを含む様々な視覚的特性情報を有することができる。
映像符号化システム100は、ディスプレイプロセッサ118を含むことができる。ディスプレイプロセッサ118は、ディスプレイインタフェース120上で表示するためにビデオデコーダ104からビデオストリーム112を受信することができる。ディスプレイインタフェース120は、ビデオストリーム112の視覚的表現を提示できるユニットである。
ディスプレイインタフェース120は、例えば、スマートフォンディスプレイ、デジタルプロジェクタ、DVDプレーヤディスプレイ、又はそれらの組み合わせを含むことができる。映像符号化システム100は、ビデオデコーダ104、ディスプレイプロセッサ118、及びディスプレイインタフェース120を個別のユニットとして示しているが、ビデオデコーダ104は、ディスプレイプロセッサ118及びディスプレイインタフェース120を含むことができることを理解されたい。
ビデオエンコーダ102は、通信経路106を通じてビデオビットストリーム110をビデオデコーダ104に送信することができる。通信経路106は、データ転送に好適な様々なネットワークとすることができる。
例示的な実施例では、映像符号化システム100は、符号化ピクチャバッファ(図示せず)を含むことができる。符号化ピクチャバッファは、アクセスユニットを含む先入れ先出しバッファとして動作でき、各アクセスユニットは、ビデオビットストリーム110の1つのフレームを含むことができる。
別の例示的な実施例では、映像符号化システム100は、仮想参照デコーダ(図示せず)を含むことができる。仮想参照デコーダは、ビデオビットストリーム110の変動性を制限するために使用されるデコーダモデルとすることができる。
例えば、通信経路106は、無線通信、有線通信、光、超音波、又はそれらの組み合わせを含むことができる。通信経路106に含めることができる無線通信の実施例は、衛星通信、セルラ通信、ブルートゥース、赤外線データ協会規格(IrDA)、ワイヤレスフィデリティ(WiFi)、及びワールドワイド・インターオペラビリティ・フォー・マイクロウェーブ・アクセス(WiMAX)である。通信経路106に含めることができる有線通信の実施例は、イーサネット、デジタル加入者線(DSL)、ファイバー・トゥ・ザ・ホーム(FTTH)、及び基本電話サービス(POTS)である。
映像符号化システム100は、様々な映像符号化シンタックス構造を用いることができる。映像符号化システム100は、例えば、高効率映像符号化/H.265ワーキングドラフトバージョンを使用してビデオ情報を符号化及び復号することができる。映像符号化シンタックスは、以下の文書で説明されており、その内容全体が引用により本明細書に組み込まれる。
B. Bross、W. Han、J Ohm、G. Sullivan、T. Wieg著 「High−Efficiency Video Coding (HEVC) text specification draft 8」 JCTVC−J1003 d7 2012年7月(Stockholm)
B. Bross、W. Han、J. Ohm、G. Sullivan、T. Wieg著 「High Efficiency Video Coding (HEVC) text specification draft 7」 JCTVC−I1003 d4 2012年5月(Geneva)
M. Haque、K. Sato、A. Tabatabai、T. Suzuki著 「Simplification of HRD parameters for Temporal Scalability」 JCTVC−J0272 2012年7月(Stockholm)
M. Haque、K. Sato、A. Tabatabai、T. Suzuki著 「HEVC VUI Parameters with Extension Hooks」 JCTVC−J0270 2012年7月(Stockholm)
M. Haque、A. Tabatabai著 「Extension of HEVC VUI Syntax Structure」 JCTVC−I0263 2012年5月
M. Haque著 「AHG10: VUI and HRD syntax designs agreed by the BoG on VPS and NUH」 JCTVC−J0548rl 2012年7月
ここで図2を参照すると、ビデオビットストリーム110の実施例が示されている。ビデオビットストリーム110は、図1のビデオコンテンツ108の符号化されたオカレンスを含み、ビデオシンタックス114を使用して復号して、図1のディスプレイインタフェース120に表示するための図1のビデオストリーム112を生成することができる。
ビデオビットストリーム110は、シンタックスタイプ202で示される様々なビデオタイプを含むことができる。シンタックスタイプ202は、ビデオビットストリーム110を符号化及び復号するために使用される映像符号化の種類のインジケータとして規定される。例えば、ビデオコンテンツ108は、アドバンスドビデオコーディング204(AVC)、スケーラブル映像符号化206(SVC)、多視点映像符号化208(MVC)、多視点映像プラス奥行き210(MVD)、及び立体的ビデオ212(SSV)に関するシンタックスタイプ202を含むことができる。
アドバンスドビデオコーディング204及びスケーラブル映像符号化206を使用して、単一視点ベースビデオを符号化してビデオビットストリーム110を生成することができる。単一視点ベースビデオは、単一のカメラから生成されるビデオコンテンツ108を含むことができる。
多視点映像符号化208、多視点映像プラス奥行き210、及び立体的ビデオ212を使用して、2つ又はそれより多いビューを有するビデオコンテンツ108を符号化することができる。多視点ビデオは、例えば、複数のカメラからのビデオコンテンツ108を含むことができる。
ビデオシンタックス114は、エントリ識別子216を含むことができる。エントリ識別子216は、複数の符号化されたビデオシーケンスを区別するための値である。符号化されたビデオシーケンスは、単一視点ビデオ、多視点ビデオ、又は立体的ビデオに関して、様々なビットレート、フレームレート、解像度、又はスケーラブルレイヤを有するビデオコンテンツ108のオカレンスを含むことができる。
ビデオシンタックス114は、ビデオコンテンツ108内の各フレームに関連するエントリ数を識別するためのエントリカウント214を含むことができる。エントリカウント214は、ビデオコンテンツ108内で表されるエントリの最大数である。
ビデオシンタックス114は、繰り返し識別子218を含むことができる。繰り返し識別子218は、ビデオコンテンツ108の個々の繰り返しを区別するための値である。
ビデオシンタックス114は、繰り返しカウント220を含むことができる。繰り返しカウント220は、ビデオコンテンツ108の最大繰り返し回数を示す値である。
スケーラブル映像符号化に関しては、この繰り返しカウントを使用して、スケーラブル映像符号化の場合の種々のスケーラブルビデオレイヤに関連する情報エントリの数を示すことができる。多視点映像符号化に関しては、繰り返しカウントを使用して、ビデオコンテンツ108のビューの数に関連する操作ポイントの数を示すことができる。
例えば、スケーラブル映像符号化では、追加の拡張レイヤを有するベースレイヤを含むようにビデオコンテンツ108を符号化して、ビデオビットストリーム110のマルチレイヤオカレンスを生成することができる。ベースレイヤは、最低の解像度、フレームレート、又は品質を有することができる。
拡張レイヤは、ビデオ品質を高めるために使用される追加の予備情報を有する段階的な改良点を含むことができる。スケーラブルビデオレイヤ拡張部は、拡張されてスケーラブル映像符号化を包含できるHEVC新規ベースライン規格を含むことができる。
ビデオシンタックス114は、操作識別子222を含むことができる。操作識別子222は、ビデオコンテンツ108の個別の操作ポイントを区別するための値である。操作ポイントは、多視点映像符号化に関して存在する情報エントリ、例えば、タイミング情報、ネットワーク抽象レイヤ(NAL)仮想参照デコーダ(HRD)パラメータ、映像符号化レイヤ(VCL)HRDパラメータ、pic_struct_present_flag要素、又はそれらの組み合わせである。
ビデオシンタックス114は、操作カウント224を含むことができる。操作カウント224は、ビデオコンテンツ108の操作ポイントの最大数を示す値である。
操作ポイントは、多視点ビデオ及び3Dビデオに関して、種々のカメラで生成されるビューのような様々なビューからの符号化ビデオシーケンスの生成に関連する。多視点映像符号化に関して、操作ポイントは、出力対象ビューと、出力対象ビューに依存する別のビューとを有するビデオビットストリーム110のサブセットに関連する。
別のビューは、それらが下位ビットストリーム抽出プロセスを使用して得られる場合に、出力対象ビューに依存する。1つより多い操作ポイントが、ビデオビットストリーム110の同じサブセットに関連することができる。例えば、操作ポイントを復号することは、図1のデバイス102での表示に関して、操作ポイントと、出力対象ビューの次の出力とに対応するビデオビットストリームのサブセットを、ビデオストリーム112の一部分として復号することに言及するものである。
ビデオシンタックス114は、ビュー識別子226を含むことができる。ビュー識別子226は、ビデオコンテンツ108の個別のビューを区別するための値である。
ビデオシンタックス114は、ビューカウント228を含むことができる。ビューカウント228は、ビデオコンテンツ108のビューの最大数を示す値である。
例えば、単一視点ビデオは、単一のカメラで生成されたビデオとすることができる。多視点ビデオは、様々な位置及び距離に位置する複数のカメラによって、シーン内で視認される対象物から生成することができる。
ビデオコンテンツ108は、様々なビデオ特性情報を含むことができる。例えば、ビデオコンテンツ108は、超高精細ビデオのような高解像度ビデオとすることができる。ビデオコンテンツ108は、7680×4320、8K×2K、4K×2K、又はそれらの組み合わせの解像度を含む、3840×2160又はそれ以上の画素解像度を有することができる。ビデオコンテンツ108は、高解像度ビデオに対応しているが、ビデオコンテンツ108は更に、高精細(HD)ビデオのような低解像度に対応できるということを理解されたい。ビデオシンタックス114は、ビデオコンテンツ108の解像度に対応することができる。
ビデオコンテンツ108は、15フレーム毎秒(fps)、24fps、25fps、30fps、50fps、60fps、及び120fpsを含む、様々なフレームレートに対応することができる。個々のフレームレートを説明したが、ビデオコンテンツ108は、ゼロフレーム毎秒及びそれ以上の固定及び可変のフレームレートに対応できることを理解されたい。ビデオシンタックス114は、ビデオコンテンツ108のフレームレートに対応することができる。
ビデオビットストリーム110は、1つ又はそれ以上の時間レイヤ230を含むことができる。時間レイヤ230は、特定のフレームレートでのビデオストリーム112を表すビデオビットストリーム110の一部分として規定される。各時間レイヤ230は、フレーム毎秒(fps)として表された種々のフレームレートでビデオストリーム112を表すことができる。時間レイヤ230は、下位レイヤを含む上位レイヤを備える階層を構成することができる。
例えば、時間レイヤ230の第1のオカレンス232は、ビデオストリーム112の15fpsオカレンスを表し、時間レイヤ230の第2のオカレンス234は、ビデオストリーム112の30fpsオカレンスを表し、時間レイヤ230の第3のオカレンス236は、ビデオストリーム112の60fpsオカレンスを表すことができる。各時間レイヤ230は、ビデオコンテンツ108を表すビデオフレーム238を含むことができる。
時間レイヤ230の第1のオカレンス232は、ビデオコンテンツ108を符号化して15fpsでのビデオストリーム112を生成するためのベースレイヤを表すことができる。時間レイヤ230の第2のオカレンス234は、時間レイヤ230の第1のオカレンス232のようなベースレイヤと、30fpsでのビデオコンテンツ108のビデオストリーム112との間の差分を表すことができる。
第2のオカレンス234は、ベースレイヤのフレームと、30fpsでのビデオコンテンツ108を表示するために要求される新しいフレームとの間の差分を表すフレームを含むことができる。時間レイヤ230の第3のオカレンス236は、時間レイヤ230の第2のオカレンス234と、60fpsでのビデオコンテンツとの間の差分を表すことができる。
例示的な実施例では、図1のビデオデコーダ104に関するスマートフォンは、第1のオカレンス232及び第2のオカレンス234からの情報を含むことができるビデオビットストリーム110から30fpsでの時間レイヤ230の第2のオカレンス234を抽出することができる。時間レイヤ230の第3のオカレンス236からのビデオビットストリーム110内の情報を切り捨てて、ビデオビットストリーム110のサイズを小さくすることができる。
ここで図3を参照すると、HEVC VUIスケーラブル拡張シンタックス302の実施例が示されている。HEVC VUIスケーラブル拡張シンタックス302は、図1のビデオビットストリーム110内の図2の時間レイヤ230の各オカレンスに関する情報を提供する。
HEVC VUIスケーラブル拡張シンタックス302は、図7のHEVC VUIスケーラブル拡張シンタックス表内の要素を表す。HEVC VUIスケーラブル拡張シンタックス302の要素は、図7のHEVC VUIスケーラブル拡張シンタックス表において表された階層構造で配列される。第1又は第2のような用語は、識別のためにのみ使用され、何らかの順番、優先度、重要性、又は優先順位を示すものではない。
HEVC VUIスケーラブル拡張シンタックス302は、vui_parameters要素のようなHEVC VUIスケーラブル拡張シンタックスヘッダ部303を含む。HEVC VUIスケーラブル拡張シンタックスヘッダ部303は、HEVC VUIスケーラブル拡張シンタックス302を識別するための記述子である。HEVC VUIスケーラブル拡張シンタックスヘッダ部303を使用して、ビデオビットストリーム110を符号化及び復号する。
HEVC VUIスケーラブル拡張シンタックス302は、図1のビデオビットストリーム110内の時間レイヤ230の数を識別するための、vui_max_temporal_layers_minus1要素のような時間レイヤカウント304を含むことができる。時間レイヤカウント304は、時間レイヤカウント304を0から時間レイヤ数マイナス1までマッピングするための時間レイヤ230数マイナス1である。
HEVC VUIスケーラブル拡張シンタックス302は、field_seq_flagのようなフィールドシーケンスフラグ306を含むことができる。フィールドシーケンスフラグ306は、符号化されたビデオシーケンス情報が、ビデオ表現フィールドを含むか否かを示す。フィールドシーケンスフラグ306は、フィールドの存在を示すための値1、及びフィールドが存在していないことを示すための値0を有することができる。
HEVC VUIスケーラブル拡張シンタックス302は、追加のタイミング情報がビデオビットストリーム110に含まれているか否かを示すための、timing_info_present_flag要素のようなタイミング情報存在フラグ308を含むことができる。タイミング情報存在フラグ308は、追加のタイミング情報がビデオビットストリーム110に含まれていないことを示すための値0を有することができる。タイミング情報存在フラグ308は、HEVC VUIスケーラブル拡張シンタックス302が、時間刻みユニット310、時間スケール312、及び固定ピクチャレートフラグ314を含むことを示すための値1を有することができる。
HEVC VUIスケーラブル拡張シンタックス302は、num_units_in_tick要素のような時間刻みユニット310を含むことができる。時間刻みユニット310は、時間スケール312の周波数で動作するクロックの時間単位数を示すことができる。例えば、時間刻みユニット310は、ビデオビットストリーム110で表すことができる最小の時間間隔に対応することができる。
HEVC VUIスケーラブル拡張シンタックス302は、time_scale要素のような時間スケール312を含むことができる。時間スケール312は、1秒の時間単位数である。
HEVC VUIスケーラブル拡張シンタックス302は、fixed_pic_rate_flag要素のような固定ピクチャレートフラグ314を含むことができる。固定ピクチャレートフラグ314は、図1のビデオストリーム112の出力順番における2つの連続的なピクチャの間の時間距離が制約されているか否かを示すことができる。固定ピクチャレートフラグ314は、制約が適用されないことを示すための値0、及び時間距離が制約されていることを示すための値1を有する。
HEVC VUIスケーラブル拡張シンタックス302は、nal_hrd_parameters_present_flag要素のようなNAL HRDパラメータ存在フラグ316を含むことができる。NAL HRDパラメータ存在フラグ316は、NAL HRDパラメータ存在情報の存在を示すことができる。
NAL HRDパラメータ存在フラグ316は、HRDパラメータ構造318がビデオビットストリーム110内に存在していることを示すための値1、又はHRDパラメータ構造318が存在していないことを示すための値0を有することができる。HRDパラメータ構造318は、HRDシンタックスのセクションで以下に規定されるHRDシンタックスのオカレンスである。
HEVC VUIスケーラブル拡張シンタックス302は、vcl_hrd_parameters_present_flag要素のようなVCL HRDパラメータ存在フラグ320を含むことができる。VCL HRDパラメータ存在フラグ320は、VCL HRDパラメータ情報の存在を示すことができる。VCL HRDパラメータ存在フラグ320は、HRDパラメータ構造318がビデオビットストリーム110内に存在していることを示すための値1、又はHRDパラメータ構造318が存在していないことを示すための値0を有することができる。
hrd_parameters要素のようなHRDパラメータ構造318は、各時間レイヤ230によって異なるHRDパラメータを含む。HRDパラメータ構造318は、HRDシンタックスのセクションで詳細に規定される。
NAL HRDパラメータ存在フラグ316又はVCL HRDパラメータ存在フラグ320が値1を有する場合には、HEVC VUIスケーラブル拡張シンタックス302は、低遅延フラグ322及びサブピクチャCPBパラメータ存在フラグ324を含むことができる。HEVC VUIスケーラブル拡張シンタックス302は、low_delay_hrd_flag要素のような低遅延フラグ322を含むことができる。低遅延フラグ322は、HRD動作モードを示すことができる。
HEVC VUIスケーラブル拡張シンタックス302は、sub_pic_cpb_params_present_flag要素のようなサブピクチャCPBパラメータ存在フラグ324を含むことができる。サブピクチャCPBパラメータ存在フラグ324は、サブピクチャCPBパラメータがビデオビットストリーム110内に存在しているか否かを示すことができる。
サブピクチャCPBパラメータ存在フラグ324が値1を有する場合には、HEVC VUIスケーラブル拡張シンタックス302は、num_of_units_in_sub_tick要素のような時間刻みサブユニット326を含むことができる。時間刻みサブユニット326は、タイミング付加拡張情報(SEI)メッセージを取り除く前に待つための時間刻み数を示すことができる。
HEVC VUIスケーラブル拡張シンタックス302は、bitstream_restriction_flag要素のようなビットストリーム制限フラグ328を含むことができる。ビットストリーム制限フラグ328は、符号化されたビデオシーケンスのビットストリーム制限パラメータが、ビデオビットストリーム110内に存在していることを示す。
ビットストリーム制限フラグ328は、ビットストリーム制限パラメータがビデオビットストリーム110に含まれている場合の値1、及びビットストリーム制限パラメータがビデオビットストリーム110内に存在していない場合の値0を有する。ビットストリーム制限パラメータは、タイル固定構成フラグ330、動きベクトルフラグ332、ピクチャ種類毎の最大バイト数334、最少CU種類毎の最大ビット数336、動きベクトル最大水平距離338、及び動きベクトル最大垂直距離340を含むことができる。
tiles_fixed_structure_flag要素のようなタイル固定構成フラグ330は、符号化されたビデオシーケンス内の各ピクチャが、同じ数のタイルを有することを示すことができる。タイル固定構成フラグ330は、固定タイルを示すための値1、及びそれ以外の場合を示すための値0を有することができる。
motion_vector_over_pic_boundaries_flag要素のような動きベクトルフラグ332は、ピクチャ境界の外部のサンプルが予測のために使用されないことを示すことができる。動きベクトルフラグ332が値1を有する場合には、ピクチャ境界外部の1つ又はそれ以上のサンプルを予測のために使用でき、それ以外の場合には、サンプルは予測のために使用されない。
max_bytes_per_pic_denom要素のようなピクチャ種類毎の最大バイト数334は、符号化されたビデオシーケンス内のいずれかの符号化されたピクチャに関連するVCL NALユニットの合計サイズに関する最大バイト数を示す値である。ピクチャ種類毎の最大バイト数334が値0を有する場合には、制限は示されない。それ以外の場合には、符号化されたピクチャを、ビデオビットストリーム110内で、ピクチャ種類毎の最大バイト数334よりも多いバイトにより表すべきではないというビットストリーム適合要件である。
max_bits_per_min_cu_denom要素のような最少CU種類毎の最大ビット数336は、符号化されたビデオシーケンスのいずれかのピクチャ内のいずれかの符号化ブロックに関する符号化ユニットデータの符号化されたビット数に関する上限を示す値である。最少CU種類毎の最大ビット数336が値0を有する場合には、制限は示されない。それ以外の場合には、符号化ユニットを、ビットストリーム内で最少CU種類毎の最大ビット数336よりも多いビットにより表すべきではないというビットストリーム適合要件である。
log2_max_mv_length_horizontal要素のような動きベクトル最大水平距離338は、ビデオビットストリーム110内の全てのピクチャに関する復号された動きベクトル水平成分の最大絶対値を示す。log2_max_mv_length_vertical要素のような動きベクトル最大垂直距離340は、ビデオビットストリーム110内の全てのピクチャに関する復号された動きベクトル垂直成分の最大絶対値を示す。
HEVC VUIスケーラブル拡張シンタックス302は、VUI拡張情報がビデオビットストリーム110に含まれていることを示すための、vui_extension_flag要素のようなVUI拡張フラグ342を含むことができる。VUI拡張フラグ342は、VUI拡張情報がビデオビットストリーム110に含まれていることを示すための値1、及びそれ以外の場合を示すための値0を有することができる。
HEVC VUIスケーラブル拡張シンタックス302は、追加のデータがRBSP内に存在していることを示すための、more_rbsp_data要素のような、追加のRBSPデータフラグ344を含むことができる。追加のRBSPデータフラグ344は、追加のデータがRBSP内に存在している場合の値1、及びそれ以外の場合の値0を有することができる。
HEVC VUIスケーラブル拡張シンタックス302は、VUI拡張データがビデオビットストリーム110に含まれていることを示すための、VUI_extension_data_flag要素のようなVUI拡張データフラグ346を含むことができる。VUI拡張データフラグ346は、VUI拡張データがビデオビットストリーム110に含まれている場合の値1、及びそれ以外の場合の値0を有することができる。
HEVC VUIスケーラブル拡張シンタックス302は、RBSPデータにフラグをたてるためのデータ構造である、rbsp_trailing_bits要素のようなRBSP追跡ビット348を含むことができる。RBSP追跡ビット348は、RBSPに関するストップビットを示すための、rbsp_stop_one_bit要素のようなRBSPデータを含むことができる。
HEVC VUIスケーラブル拡張シンタックス302は、時間レイヤ特有の情報を表すためのループ構造を含むことができる。ループは、時間レイヤ230の各オカレンスに関連する情報を0から時間レイヤカウント304まで示すための、[i]のようなイテレータを含むことができる。例えば、HEVC VUIスケーラブル拡張シンタックス302のループ構造は、フィールドシーケンスフラグ306、タイミング情報存在フラグ、時間刻みユニット310、時間スケール312、固定ピクチャレートフラグ314、NAL HRDパラメータ存在フラグ316、VCL HRDパラメータ存在フラグ320、HRDパラメータ構造318、低遅延フラグ322、サブピクチャCPBパラメータ存在フラグ324、及び時間刻みサブユニット326を含むことができる。
HEVC VUIスケーラブル拡張シンタックス302を使用して図1のビデオコンテンツ108を符号化及び復号して、時間レイヤ230の各オカレンスに対応することにより、時間レイヤ230の各オカレンスの表現にわたるより高精度で精細な制御が提供されることが見いだされている。時間レイヤ230の各オカレンスに関する情報を提供することにより、ビデオストリーム112の表示品質が向上する。
ここで図4を参照すると、HRDシンタックス402の実施例が示されている。HRDシンタックス402は、仮想参照デコーダに関連するパラメータを表す。
HRDシンタックス402は、図4のHRDベースシンタックス表で表された要素を含む。HRDシンタックス402の要素は、図4のHRDベースシンタックス表において表された階層構造で配列される。
HRDシンタックス402は、hrd_parameters要素のようなHRDシンタックスヘッダ部404を含むことができる。HRDシンタックスヘッダ部404は、HRDシンタックス402を識別するための記述子である。
HRDシンタックス402は、cpb_cnt_minus1要素のようなCPBカウント408を含むことができる。CPBカウント408は、制限されたビットレート及びCPBサイズ値を有する別の配信スケジューラの数を示すことができる。
HRDシンタックス402は、bit_rate_scale要素のようなビットレートスケール410を含むことができる。ビットレートスケール410は、符号化ピクチャバッファ(CPB)の最大入力ビットレートを指定する。
HRDシンタックス402は、cpb_size_scale要素のようなCPBサイズスケール412を含むことができる。CPBサイズスケール412は、符号化ピクチャバッファのサイズを判定するためのものである。
HRDシンタックス402は、符号化ピクチャバッファの各オカレンスに関するパラメータセットを規定するためのループ構造を含むことができる。ループ構造は、SchedSelIdx要素のようなスケジュール選択インデックスに基づく大きさである。HRDシンタックス402は、符号化ピクチャバッファの各オカレンスに関するビットレート値416、CPBサイズ値418、及びCBRフラグ420を含むことができる。
HRDシンタックス402は、bit_rate_value_minus1要素のようなビットレート値416を含むことができる。ビットレート値416を使用して、符号化ピクチャバッファの各オカレンスに関する最大入力ビットレートを指定することができる。
HRDシンタックス402は、cpb_size_value_minus1要素のようなCPBサイズ値418を含むことができる。CPBサイズ値418を使用して、符号化ピクチャバッファの各オカレンスのサイズを判定することができる。
HRDシンタックス402は、cbr_flag要素のようなCBRフラグ420を含むことができる。CBRフラグ420は、符号化ピクチャバッファの各オカレンスに関して図1のビデオビットストリーム110を復号するための動作モードを示す。CBRフラグ420が値1を有する場合には、仮想ストリーム配信スケジューラ(HSS)は、固定ビットレートモードで動作する。それ以外の場合には、ビデオビットストリーム110は、断続的なビットレートモードで動作する。
HRDシンタックス402を使用することにより、符号化ピクチャバッファの個別のオカレンスの処理にわたるより高精度で精細な制御を可能にすることによって性能を向上できることが見いだされている。HRDシンタックス402の個別のオカレンスを使用することにより、CPBの種々のオカレンス間の個別の差分を利用することによって処理速度を向上させることができる。
HRDシンタックス402は、initial_cpb_removal_delay_length_minus1要素のような初期CPB除去遅延長422を含むことができる。初期CPB除去遅延長422は、バッファリング期間SEIメッセージのinitial_cpb_removal_delay要素及びinitial_cpb_removal_offset要素のビット長を示す。
HRDシンタックス402は、cpb_removal_delay_length_minus1要素のようなCPB除去遅延長424を含むことができる。CPB除去遅延長424は、ピクチャタイミングSEIメッセージ内のcpb_removal_delay要素のビット長を指定することができる。
HRDシンタックス402は、dpb_output_delay_length_minus1要素のようなDPB出力遅延長426を含むことができる。DPB出力遅延長426は、復号ピクチャバッファ(DPB)のサイズを示す。
HRDシンタックス402は、time_offset_length要素のような時間オフセット長428を含むことができる。時間オフセット長428は、time_offset要素のビット長を示す。
HRDシンタックス402は、ビデオビットストリーム110に関する標準の要件セットを表すことができる。HRDシンタックス402を使用して、ビデオビットストリーム110のビットレートを制御することができる。例えば、HRDシンタックス402は、可変又は固定ビットレート動作、低遅延動作、及び遅延耐性動作を制御するためのパラメータを含むことができる。
別の実施例では、HRDシンタックス402は、ビットレートスケール410、CPBカウント408、及びCPBサイズスケール412のようなパラメータを使用して、符号化ピクチャバッファの性能、符号化ピクチャバッファの数、及び符号化ピクチャバッファのサイズを制御するために使用される。HRDシンタックス402は、DPB出力遅延長426のようなパラメータを使用して復号ピクチャバッファを制御するために使用することができる。
ビデオビットストリーム110は、NAL HRDパラメータ及びVCL HRDパラメータを含むことができる。NAL HRDパラメータは、非VCL NALユニットデータを有するビデオビットストリーム110に関連する。VCL HRDパラメータは、VCL NALユニットデータを有するビデオビットストリーム110に関連する。
図3のHRDパラメータ構造318は、仮想参照デコーダに関するパラメータを表すデータ構造のオカレンスである。例えば、HRDパラメータ構造318は、HRDシンタックス402で表すことができる。
HRDシンタックス402を使用して図1のビデオコンテンツ108を符号化及び復号することにより、ビデオビットストリーム110のサイズを減少させることができ、図1のビデオストリーム112を表示するために必要なビデオバッファリングの量が減少することが見いだされている。ビデオビットストリーム110のサイズが減少することにより、機能性が向上し、ビデオストリーム112の表示性能が向上する。
ここで図5を参照すると、HRD固定シンタックス502の実施例が示されている。HRD固定シンタックス502は、図2の時間レイヤ230、サブレイヤ、又はCPBに基づいて変化しない、仮想参照デコーダ動作に関連するパラメータを表す。
HRD固定シンタックス502は、図5のHRD固定シンタックス表で表された要素を含む。HRD固定シンタックス502の要素は、図5のHRD固定シンタックス表において表された階層構造で配列される。
HRD固定シンタックス502は、hrd_parameters_fixed要素のようなHRD固定シンタックスヘッダ部504を含むことができる。HRD固定シンタックスヘッダ部504は、HRD固定シンタックス502を識別するための記述子である。
HRD固定シンタックス502は、bit_rate_scale要素のようなビットレートスケール410を含むことができる。ビットレートスケール410は、符号化ピクチャバッファ(CPB)の最大入力ビットレートを指定する。
HRD固定シンタックス502は、cpb_size_scale要素のようなCPBサイズスケール412を含むことができる。CPBサイズスケール412は、符号化ピクチャバッファのサイズを判定するためのものである。
HRD固定シンタックス502は、initial_cpb_removal_delay_length_minus1要素のような初期CPB除去遅延長422を含むことができる。初期CPB除去遅延長422は、バッファリング期間SEIメッセージのinitial_cpb_removal_delay要素及びinitial_cpb_removal_offset要素のビット長を示す。
HRD固定シンタックス502は、cpb_removal_delay_length_minus1要素のようなCPB除去遅延長424を含むことができる。CPB除去遅延長424は、ピクチャタイミングSEIメッセージ内のcpb_removal_delay要素のビット長を指定することができる。
HRD固定シンタックス502は、dpb_output_delay_length_minus1要素のようなDPB出力遅延長426を含むことができる。DPB出力遅延長426は、復号ピクチャバッファ(DPB)のサイズを示す。
HRDシンタックス402は、time_offset_length要素のような時間オフセット長428を含むことができる。時間オフセット長428は、time_offset要素のようなビット長を示す。
図3のHRDパラメータ構造318は、仮想参照デコーダに関するパラメータを表すデータ構造のオカレンスである。例えば、HRDパラメータ構造318は、HRD固定シンタックス502で表すことができる。
HRD固定シンタックス502を使用することにより、復号プロセスの処理にわたる安定した制御を可能にすることによって、動作を単純化して、複雑性を低減できることが見いだされている。HRD固定シンタックス502を使用することにより、全ての時間レイヤ230にわたるHRD固定シンタックス502に関する固定値の単一セットを共有することによって複雑性を低減することができる。
ここで図6を参照すると、HRD可変シンタックス602の実施例が示されている。HRD可変シンタックス602は、仮想参照デコーダ動作に関連する可変パラメータを表す。
HRD可変シンタックス602は、図6のHRD可変シンタックス表で表された要素を含む。HRD可変シンタックス602の要素は、図6のHRD可変シンタックス表において表された階層構造で配列される。
HRD可変シンタックス602は、hrd_parameters_var要素のようなHRD可変シンタックスヘッダ部604を含むことができる。HRD可変シンタックスヘッダ部604は、HRD可変シンタックス602を識別するための記述子である。
HRD可変シンタックス602は、cpb_cnt_minus1要素のようなCPBカウント408を含むことができる。CPBカウント408は、図1のビデオビットストリーム110内の別のCPB規格値の数を示すことができる。
HRD可変シンタックス602は、符号化ピクチャバッファの各オカレンスに関するパラメータセットを規定するためのループ構造を含むことができる。ループ構造は、SchedSelIdx要素のようなスケジュール選択インデックス414に基づく大きさである。HRD可変シンタックス602は、符号化ピクチャバッファの各オカレンスに関するビットレート値416、CPBサイズ値418、及びCBRフラグ420を含むことができる。
HRD可変シンタックス602は、bit_rate_value_minus1要素のようなビットレート値416を含むことができる。ビットレート値416を使用して、符号化ピクチャバッファの各オカレンスに関する最大入力ビットレートを指定することができる。
HRD可変シンタックス602は、cpb_size_value_minus1要素のようなCPBサイズ値418を含むことができる。CPBサイズ値418を使用して、符号化ピクチャバッファの各オカレンスのサイズを判定することができる。
HRD可変シンタックス602は、cbr_flag要素のようなCBRフラグ420を含むことができる。CBRフラグ420は、符号化ピクチャバッファの各オカレンスに関してビデオビットストリーム110を復号するための動作モードを示す。
HRDパラメータ構造318は、仮想参照デコーダに関するパラメータを表すデータ構造のオカレンスである。例えば、HRDパラメータ構造318は、HRD可変シンタックス602で表すことができる。
HRD可変シンタックス602を使用することにより、時間レイヤ230の符号化ピクチャバッファの処理にわたるより高精度で精細な制御を可能にすることによって性能を向上できることが見いだされている。HRD可変シンタックス602の個別のオカレンスを使用することにより、時間レイヤ230の種々のオカレンス間の個別の差分を利用することによって処理速度を向上することができる。
ここで図7を参照すると、第1のHEVC VUI拡張シンタックス702の実施例が示されている。第1のHEVC VUI拡張シンタックス702は、図1のビデオビットストリーム110内の図2の時間レイヤ230の各オカレンスに関する情報を提供する。
第1のHEVC VUI拡張シンタックス702は、図7の第1のHEVC VUI拡張シンタックス表内の要素を表す。第1のHEVC VUI拡張シンタックス702の要素は、図7の第1のHEVC VUI拡張シンタックス表において表された階層構造で配列される。
図3のHEVC VUIスケーラブル拡張シンタックス302は、図1の映像符号化システム100のVUIパラメータを表すことができる。例えば、HEVC VUIスケーラブル拡張シンタックス302は、第1のHEVC VUI拡張シンタックス702のオカレンスとすることができる。第1又は第2のような用語は、識別のためにのみ使用され、何らかの順番、優先度、重要性、又は優先順位を示すものではない。
第1のHEVC VUI拡張シンタックス702は、vui_parameters要素のような第1のHEVC VUI拡張シンタックスヘッダ部704を含む。第1のHEVC VUI拡張シンタックスヘッダ部704は、第1のHEVC VUI拡張シンタックス702を識別するための記述子である。第1のHEVC VUI拡張シンタックス702を使用して、ビデオビットストリーム110を符号化及び復号する。
第1のHEVC VUI拡張シンタックス702は、hrd_parameters_fixed要素のようなHRD固定パラメータ構造706を含むことができる。HRD固定パラメータ構造706は、図5のHRD固定シンタックス502のオカレンスである。HRD固定パラメータ構造706は、全ての時間レイヤ230に関して一定のHRDパラメータを含む。HRD固定パラメータ構造706は、NAL HRD及びVCL仮想参照デコーダの両方に関する情報を含む。
第1のHEVC VUI拡張シンタックス702は、図1のビデオビットストリーム110内の時間レイヤ230の数を識別するための、vui_max_temporal_layers_minus1要素のような時間レイヤカウント304を含むことができる。第1のHEVC VUI拡張シンタックス702は、field_seq_flagのようなフィールドシーケンスフラグ306を含むことができる。フィールドシーケンスフラグ306は、符号化されたビデオシーケンス情報が、ビデオ表現フィールドを含むか否かを示す。
timing_info_present_flag要素のようなタイミング情報存在フラグ308は、追加のタイミング情報がビデオビットストリーム110に含まれているか否かを示すことができる。タイミング情報存在フラグ308は、追加のタイミング情報がビデオビットストリーム110に含まれていないことを示すための値0を有することができる。タイミング情報存在フラグ308は、第1のHEVC VUI拡張シンタックス702が、時間刻みユニット310、時間スケール312、及び固定ピクチャレートフラグ314を含むことを示すための値1を有することができる。
第1のHEVC VUI拡張シンタックス702は、num_units_in_tick要素のような時間刻みユニット310を含むことができる。時間刻みユニット310は、時間スケール312の周波数で動作するクロックの時間単位数を示すことができる。
第1のHEVC VUI拡張シンタックス702は、time_scale要素のような時間スケール312を含むことができる。時間スケール312は、1秒の時間単位数である。
第1のHEVC VUI拡張シンタックス702は、fixed_pic_rate_flag要素のような固定ピクチャレートフラグ314を含むことができる。固定ピクチャレートフラグ314は、図1のビデオストリーム112の出力順番における2つの連続的なピクチャの間の時間距離が制約されているか否かを示すことができる。
第1のHEVC VUI拡張シンタックス702は、nal_hrd_parameters_present_flag要素のようなNAL HRDパラメータ存在フラグ316を含むことができる。NAL HRDパラメータ存在フラグ316は、NAL HRDパラメータ情報の存在を示すことができる。NAL HRDパラメータ存在フラグ316は、HRD可変パラメータ構造708がビデオビットストリーム110内に存在していることを示すための値1、又はHRD可変パラメータ構造708が存在していないことを示すための値0を有することができる。
第1のHEVC VUI拡張シンタックス702は、vcl_hrd_parameters_present_flag要素のようなVCL HRDパラメータ存在フラグ320を含むことができる。VCL HRDパラメータ存在フラグ320は、VCL HRDパラメータ情報の存在を示すことができる。VCL HRDパラメータ存在フラグ320は、HRD可変パラメータ構造708がビデオビットストリーム110内に存在していることを示すための値1、又はHRD可変パラメータ構造708が存在していないことを示すための値0を有することができる。
hrd_parameters_var要素のようなHRD可変パラメータ構造708は、各時間レイヤ230によって異なるHRDパラメータを含む。HRD可変パラメータ構造708は、HRD可変シンタックスのセクションで詳細に規定される。HRD可変パラメータ構造708は、図4のCPBカウント408、図4のビットレート値416、図4のCPBサイズ値418、及び図4のCBRフラグ420を含む。HRD可変パラメータ構造708は、各時間レイヤ230によって異なるものとすることができる。
NAL HRDパラメータ存在フラグ316又はVCL HRDパラメータ存在フラグ320が値1を有する場合には、第1のHEVC VUI拡張シンタックス702は、低遅延フラグ322及びサブピクチャCPBパラメータ存在フラグ324を含むことができる。第1のHEVC VUI拡張シンタックス702は、low_delay_hrd_flag要素のような低遅延フラグ322を含むことができる。低遅延フラグ322は、HRD動作モードを示すことができる。
第1のHEVC VUI拡張シンタックス702は、sub_pic_cpb_params_present_flag要素のようなサブピクチャCPBパラメータ存在フラグ324を含むことができる。サブピクチャCPBパラメータ存在フラグ324は、サブピクチャCPBパラメータがビデオビットストリーム110内に存在しているか否かを示すことができる。
サブピクチャCPBパラメータ存在フラグ324が値1を有する場合には、第1のHEVC VUI拡張シンタックス702は、num_of_units_in_sub_tick要素のような時間刻みサブユニット326を含むことができる。時間刻みサブユニット326は、タイミング付加拡張情報(SEI)メッセージを取り除く前に待つための時間刻み数を示すことができる。
第1のHEVC VUI拡張シンタックス702は、bitstream_restriction_flag要素のようなビットストリーム制限フラグ328を含むことができる。ビットストリーム制限フラグ328は、符号化されたビデオシーケンスのビットストリーム制限パラメータが、ビデオビットストリーム110内に存在していることを示す。
ビットストリーム制限フラグ328は、ビットストリーム制限パラメータがビデオビットストリーム110に含まれている場合の値1、及びビットストリーム制限パラメータがビデオビットストリーム110内に存在していない場合の値0を有する。ビットストリーム制限パラメータは、タイル固定構成フラグ330、動きベクトルフラグ332、ピクチャ種類毎の最大バイト数334、最少CU種類毎の最大ビット数336、動きベクトル最大水平距離338、及び動きベクトル最大垂直距離340を含むことができる。
tiles_fixed_structure_flag要素のようなタイル固定構成フラグ330は、符号化されたビデオシーケンス内の各ピクチャが、同じ数のタイルを有することを示すことができる。motion_vector_over_pic_boundaries_flag要素のような動きベクトルフラグ332は、ピクチャ境界の外部のサンプルが予測のために使用されないことを示すことができる。
max_bytes_per_pic_denom要素のようなピクチャ種類毎の最大バイト数334は、符号化されたビデオシーケンス内のいずれかの符号化されたピクチャに関連するVCL NALユニットの合計サイズに関する最大バイト数を示す値である。max_bits_per_min_cu_denom要素のような最少CU種類毎の最大ビット数336は、符号化されたビデオシーケンスのいずれかのピクチャ内のいずれかの符号化ブロックに関する符号化ユニットデータの符号化されたビット数に関する上限を示す値である。
log2_max_mv_length_horizontal要素のような動きベクトル最大水平距離338は、ビデオビットストリーム110内の全てのピクチャに関する復号された動きベクトル水平成分の最大絶対値を示す。log2_max_mv_length_vertical要素のような動きベクトル最大垂直距離340は、ビデオビットストリーム110内の全てのピクチャに関する復号された動きベクトル垂直成分の最大絶対値を示す。
第1のHEVC VUI拡張シンタックス702は、VUI拡張情報がビデオビットストリーム110に含まれていることを示すための、vui_extension_flag要素のようなVUI拡張フラグ342を含むことができる。VUI拡張フラグ342は、VUI拡張情報がビデオビットストリーム110に含まれていることを示すための値1、及びそれ以外の場合を示すための値0を有することができる。
第1のHEVC VUI拡張シンタックス702は、追加のデータがRBSP内に存在していることを示すための、more_rbsp_data要素のような、追加のRBSPデータフラグ344を含むことができる。追加のRBSPデータフラグ344は、追加のデータがRBSP内に存在している場合の値1、及びそれ以外の場合の値0を有することができる。
第1のHEVC VUI拡張シンタックス702は、VUI拡張データがビデオビットストリーム110に含まれていることを示すための、VUI_extension_data_flag要素のようなVUI拡張データフラグ346を含むことができる。VUI拡張データフラグ346は、VUI拡張データがビデオビットストリーム110に含まれている場合の値1、及びそれ以外の場合の値0を有することができる。
第1のHEVC VUI拡張シンタックス702は、RBSPデータにフラグをたてるためのデータ構造である、rbsp_trailing_bits要素のようなRBSP追跡ビット348を含むことができる。RBSP追跡ビット348は、RBSPに関するストップビットを示すための、rbsp_stop_one_bit要素のようなRBSPデータを含むことができる。
第1のHEVC VUI拡張シンタックス702は、時間レイヤ特有の情報を表すためのループ構造を含むことができる。ループは、時間レイヤ230の各オカレンスに関連する情報を0から時間レイヤカウント304まで示すための、[i]のようなイテレータを含むことができる。例えば、第1のHEVC VUI拡張シンタックス702のループ構造は、フィールドシーケンスフラグ306、タイミング情報存在フラグ、時間刻みユニット310、時間スケール312、固定ピクチャレートフラグ314、NAL HRDパラメータ存在フラグ316、VCL HRDパラメータ存在フラグ320、HRD可変パラメータ構造708、低遅延フラグ322、サブピクチャCPBパラメータ存在フラグ324、及び時間刻みサブユニット326を含むことができる。
第1のHEVC VUI拡張シンタックス702は、時間レイヤ特有の情報を表すループ構造の外側のHRD固定パラメータ構造706を含む。HRD可変パラメータ構造708は、時間レイヤ特有の情報を表すループ構造の一部分である。HRD可変パラメータ構造708は、NAL HRD及びVCL HRDの両方に関するパラメータを含むことができる。
全ての時間レイヤ230に関して一定のHRD固定パラメータ構造706と、各時間レイヤ230に関して可変のHRD可変パラメータ構造708とを有する第1のHEVC VUI拡張シンタックス702を使用して、図1のビデオコンテンツ108を符号化及び復号することにより、複雑性を低減し性能を向上できることが見いだされている。HRD固定パラメータ構造706は、復号プロセスの処理にわたる安定した制御を可能にすることによって、動作を単純化し、複雑性を低減することができる。HRD可変パラメータ構造708は、時間レイヤ230の各オカレンスの表現にわたるより高精度で精細な制御を提供する。
ここで図8を参照すると、第2のHEVC VUI拡張シンタックス802の実施例が示されている。第2のHEVC VUI拡張シンタックス802は、図1のビデオビットストリーム110内の図2の時間レイヤ230の各オカレンスに関する情報を提供する。
第2のHEVC VUI拡張シンタックス802は、図8の第2のHEVC VUI拡張シンタックス表内の要素を表す。第2のHEVC VUI拡張シンタックス802の要素は、図8の第2のHEVC VUI拡張シンタックス表において表された階層構造で配列される。
第2のHEVC VUI拡張シンタックス802は、vui_parameters要素のような第2のHEVC VUI拡張シンタックスヘッダ部804を含む。第2のHEVC VUI拡張シンタックスヘッダ部804は、第2のHEVC VUI拡張シンタックス802を識別するための記述子である。第2のHEVC VUI拡張シンタックス802を使用して、ビデオビットストリーム110を符号化及び復号する。
図3のHEVC VUIスケーラブル拡張シンタックス302は、図1の映像符号化システム100のVUIパラメータを表すことができる。例えば、HEVC VUIスケーラブル拡張シンタックス302は、第2のHEVC VUI拡張シンタックス802のオカレンスとすることができる。第1又は第2のような用語は、識別のためにのみ使用され、何らかの順番、優先度、重要性、又は優先順位を示すものではない。
第2のHEVC VUI拡張シンタックス802は、図1のビデオビットストリーム110内の時間レイヤ230の数を識別するための、vui_max_temporal_layers_minus1要素のような時間レイヤカウント304を含むことができる。時間レイヤカウント304は、時間レイヤカウント304を0から時間レイヤ数マイナス1までマッピングするための時間レイヤ230数マイナス1である。
第2のHEVC VUI拡張シンタックス802は、hrd_parameters_fixed_nal要素のようなHRD NAL固定パラメータ構造806を含むことができる。HRD NAL固定パラメータ構造806は、全ての時間レイヤ230に関して一定のネットワーク抽象レイヤに関するHRDパラメータを含む。
第2のHEVC VUI拡張シンタックス802は、hrd_parameters_fixed_vcl要素のようなHRD VCL固定パラメータ構造808を含むことができる。HRD VCL固定パラメータ構造808は、全ての時間レイヤ230に関して一定の、映像符号化レイヤに関するHRDパラメータを含む。
HRD NAL固定パラメータ構造806は、VCLエンコーダのスライス出力を、パケットネットワークを通じた伝達に好適なNALユニットにカプセル化するためのネットワーク抽象レイヤパラメータに言及することができる。VCLビデオデータ及び非VCLメタデータは、様々なネットワークに向けてフォーマットすることができ、様々なネットワークタイプを通じてビデオコンテンツ108を搬送するためのネットワーク適合性を提供する。
HRD VCL固定パラメータ構造808は、信号処理関連パラメータを含むこと、及び効率的な方法でビデオコンテンツ108を表すことができる。映像符号化レイヤパラメータを使用して、フレームの一部分に関する符号化画素ブロックを含むビット列であるスライスを符号化及び復号することができる。
HRD NAL固定パラメータ構造806及びHRD VCL固定パラメータ構造808のシンタックス構造は、図7のHRD固定パラメータ構造708と同じ要素を有することができる。ビデオビットストリーム110は、ネットワーク抽象レイヤ及び映像符号化レイヤを含む、ビデオ及びメタデータ情報の複数のレイヤを復号することができる。HRD NAL固定パラメータ構造806は、ビデオビットストリーム110内のネットワーク抽象レイヤ情報に適用することができる。HRD VCL固定パラメータ構造808は、ビデオビットストリーム110内の映像符号化レイヤ情報に適用することができる。
ビデオビットストリーム110は、図1のビデオコンテンツ108からのフレームを含むことができる。フレームは、フレーム内の画素ブロックを表すことができる複数のスライスに分割することができる。
ビデオビットストリーム110は、情報ペイロードを有するネットワーク抽象レイヤパケットを含むことができる。情報ペイロードは、それぞれビデオ情報及びメタデータのような、VCL及び非VCL情報を含むことができる。
第2のHEVC VUI拡張シンタックス802は、field_seq_flagのようなフィールドシーケンスフラグ306を含むことができる。フィールドシーケンスフラグ306は、符号化されたビデオシーケンス情報が、ビデオ表現フィールドを含むか否かを示す。フィールドシーケンスフラグ306は、フィールドの存在を示すための値1、及びフィールドが存在しないことを示すための値0を有することができる。
timing_info_present_flag要素のようなタイミング情報存在フラグ308は、追加のタイミング情報がビデオビットストリーム110に含まれているか否かを示すことができる。タイミング情報存在フラグ308は、追加のタイミング情報がビデオビットストリーム110に含まれていないことを示すための値0を有することができる。タイミング情報存在フラグ308は、第2のHEVC VUI拡張シンタックス802が、時間刻みユニット310、時間スケール312、及び固定ピクチャレートフラグ314を含むことを示すための値1を有することができる。
第2のHEVC VUI拡張シンタックス802は、num_units_in_tick要素のような時間刻みユニット310を含むことができる。時間刻みユニット310は、時間スケール312の周波数で動作するクロックの時間単位数を示すことができる。
第2のHEVC VUI拡張シンタックス802は、time_scale要素のような時間スケール312を含むことができる。時間スケール312は、1秒の時間単位数である。
第2のHEVC VUI拡張シンタックス802は、fixed_pic_rate_flag要素のような固定ピクチャレートフラグ314を含むことができる。固定ピクチャレートフラグ314は、図1のビデオストリーム112の出力順番における2つの連続的なピクチャの間の時間距離が制約されているか否かを示すことができる。
第2のHEVC VUI拡張シンタックス802は、nal_hrd_parameters_present_flag要素のようなNAL HRDパラメータ存在フラグ316を含むことができる。NAL HRDパラメータ存在フラグ316は、NAL HRDパラメータ情報の存在を示すことができる。NAL HRDパラメータ存在フラグ316は、HRD可変パラメータ構造708がビデオビットストリーム110内に存在していることを示すための値1、又はHRD可変パラメータ構造708が存在していないことを示すための値0を有することができる。
第2のHEVC VUI拡張シンタックス802は、vcl_hrd_parameters_present_flag要素のようなVCL HRDパラメータ存在フラグ320を含むことができる。VCL HRDパラメータ存在フラグ320は、VCL HRDパラメータ情報の存在を示すことができる。VCL HRDパラメータ存在フラグ320は、HRD可変パラメータ構造708がビデオビットストリーム110内に存在していることを示すための値1、又はHRD可変パラメータ構造708が存在していないことを示すための値0を有することができる。
hrd_parameters_var要素のようなHRD可変パラメータ構造708は、各時間レイヤ230によって異なるHRDパラメータを含む。HRD可変パラメータ構造708は、HRD可変シンタックスのセクションで詳細に規定される。HRD可変パラメータ構造708は、CPBカウント408、ビットレート値416、CPBサイズ値418、及びCBRフラグ420を含む。HRD可変パラメータ構造708は、各時間レイヤ230によって異なるものとすることができる。
NAL HRDパラメータ存在フラグ316又はVCL HRDパラメータ存在フラグ320が値1を有する場合には、第2のHEVC VUI拡張シンタックス802は、低遅延フラグ322及びサブピクチャCPBパラメータ存在フラグ324を含むことができる。第2のHEVC VUI拡張シンタックス802は、low_delay_hrd_flag要素のような低遅延フラグ322を含むことができる。低遅延フラグ322は、HRD動作モードを示すことができる。
第2のHEVC VUI拡張シンタックス802は、sub_pic_cpb_params_present_flag要素のようなサブピクチャCPBパラメータ存在フラグ324を含むことができる。サブピクチャCPBパラメータ存在フラグ324は、サブピクチャCPBパラメータがビデオビットストリーム110内に存在しているか否かを示すことができる。
サブピクチャCPBパラメータ存在フラグ324が値1を有する場合には、第2のHEVC VUI拡張シンタックス802は、num_of_units_in_sub_tick要素のような時間刻みサブユニット326を含むことができる。時間刻みサブユニット326は、タイミング付加拡張情報(SEI)メッセージを取り除く前に待つための時間刻み数を示すことができる。
第2のHEVC VUI拡張シンタックス802は、bitstream_restriction_flag要素のようなビットストリーム制限フラグ328を含むことができる。ビットストリーム制限フラグ328は、符号化されたビデオシーケンスのビットストリーム制限パラメータが、ビデオビットストリーム110内に存在していることを示す。
ビットストリーム制限フラグ328は、ビットストリーム制限パラメータがビデオビットストリーム110に含まれている場合の値1、及びビットストリーム制限パラメータがビデオビットストリーム110内に存在していない場合の値0を有する。ビットストリーム制限パラメータは、タイル固定構成フラグ330、動きベクトルフラグ332、ピクチャ種類毎の最大バイト数334、最少CU種類毎の最大ビット数336、動きベクトル最大水平距離338、及び動きベクトル最大垂直距離340を含むことができる。
tiles_fixed_structure_flag要素のようなタイル固定構成フラグ330は、符号化されたビデオシーケンス内の各ピクチャが、同じ数のタイルを有することを示すことができる。motion_vector_over_pic_boundaries_flag要素のような動きベクトルフラグ332は、ピクチャ境界の外部のサンプルが予測のために使用されないことを示すことができる。
max_bytes_per_pic_denom要素のようなピクチャ種類毎の最大バイト数334は、符号化されたビデオシーケンス内のいずれかの符号化されたピクチャに関連するVCL NALユニットの合計サイズに関する最大バイト数を示す値である。max_bits_per_min_cu_denom要素のような最少CU種類毎の最大ビット数336は、符号化されたビデオシーケンスのいずれかのピクチャ内のいずれかの符号化ブロックに関する符号化ユニットデータの符号化されたビット数に関する上限を示す値である。
log2_max_mv_length_horizontal要素のような動きベクトル最大水平距離338は、ビデオビットストリーム110内の全てのピクチャに関する復号された動きベクトル水平成分の最大絶対値を示す。log2_max_mv_length_vertical要素のような動きベクトル最大垂直距離340は、ビデオビットストリーム110内の全てのピクチャに関する復号された動きベクトル垂直成分の最大絶対値を示す。
第2のHEVC VUI拡張シンタックス802は、VUI拡張情報がビデオビットストリーム110に含まれていることを示すための、vui_extension_flag要素のようなVUI拡張フラグ342を含むことができる。VUI拡張フラグ342は、VUI拡張情報がビデオビットストリーム110に含まれていることを示すための値1、及びそれ以外の場合を示すための値0を有することができる。
第2のHEVC VUI拡張シンタックス802は、追加のデータがRBSP内に存在していることを示すための、more_rbsp_data要素のような、追加のRBSPデータフラグ344を含むことができる。追加のRBSPデータフラグ344は、追加のデータがRBSP内に存在している場合の値1、及びそれ以外の場合の値0を有することができる。
第2のHEVC VUI拡張シンタックス802は、VUI拡張データがビデオビットストリーム110に含まれていることを示すための、VUI_extension_data_flag要素のようなVUI拡張データフラグ346を含むことができる。VUI拡張データフラグ346は、VUI拡張データがビデオビットストリーム110に含まれている場合の値1、及びそれ以外の場合の値0を有することができる。
第2のHEVC VUI拡張シンタックス802は、RBSPデータにフラグをたてるためのデータ構造である、rbsp_trailing_bits要素のようなRBSP追跡ビット348を含むことができる。RBSP追跡ビット348は、RBSPに関するストップビットを示すための、rbsp_stop_one_bit要素のようなRBSPデータを含むことができる。
第2のHEVC VUI拡張シンタックス802は、時間レイヤ特有の情報を表すためのループ構造を含むことができる。ループは、時間レイヤ230の各オカレンスに関連する情報を0から時間レイヤカウント304まで示すための、[i]のようなイテレータを含むことができる。例えば、第2のHEVC VUI拡張シンタックス802のループ構造は、フィールドシーケンスフラグ306、タイミング情報存在フラグ、時間刻みユニット310、時間スケール312、固定ピクチャレートフラグ314、NAL HRDパラメータ存在フラグ316、VCL HRDパラメータ存在フラグ320、HRD可変パラメータ構造708、低遅延フラグ322、サブピクチャCPBパラメータ存在フラグ324、及び時間刻みサブユニット326を含むことができる。
HRD NAL固定パラメータ構造806及びHRD VCL固定パラメータ構造808を有する第2のHEVC VUI拡張シンタックス802を使用して、図1のビデオコンテンツ108を符号化及び復号することにより、HRD NAL固定パラメータ構造806及びHRD VCL固定パラメータ構造808をループ構造から取り除くことによって、複雑性を低減できることが見いだされている。全ての時間レイヤ230に関して一定の値を提供することにより、図1の映像符号化システム100の動作が単純化される。
ここで図9を参照すると、HRDベースシンタックス902の実施例が示されている。HRDベースシンタックス902は、仮想参照デコーダの動作に関連するパラメータを表す。
HRDベースシンタックス902は、図9のHRDシンタックス表で表された要素を含む。HRDベースシンタックス902の要素は、図9のHRDシンタックス表において表された階層構造で配列される。
HRDベースシンタックス902は、hrd_parameters要素のようなHRDベースシンタックスヘッダ部904を含むことができる。HRDベースシンタックスヘッダ部904は、HRDベースシンタックス902を識別するための記述子である。
HRDベースシンタックス902は、タイミング存在情報、NAL HRDパラメータ、VCL HRDパラメータ、及び固定ピクチャレート情報を含む、図3のHRDパラメータ構造318を含むことができる。タイミング存在情報は、タイミング情報存在フラグ308、時間刻みユニット310、及び時間スケール312を含むことができる。
timing_info_present_flag要素のようなタイミング情報存在フラグ308は、タイミング情報が図1のビデオビットストリーム110に含まれているか否かを示すことができる。タイミング情報存在フラグ308は、タイミング情報がビデオビットストリーム110内に存在していることを示すための値1、及びタイミング情報がビデオビットストリーム110内に存在していないことを示すための値0を有することができる。
num_units_in_tick要素のような時間刻みユニット310は、時間スケール312の周波数で動作するクロックの時間単位数を示すことができる。例えば、時間刻みユニット310は、ビデオビットストリーム110で表すことができる最小の時間間隔に対応することができる。time_scale要素のような時間スケール312は、1秒の時間単位数である。
nal_hrd_parameters_present_flag要素のようなNAL HRDパラメータ存在フラグ316は、NAL HRDパラメータ情報の存在を示すことができる。NAL HRDパラメータ存在フラグ316は、HRDベースシンタックス902が存在していることを示すための値1、及びHRDベースシンタックス902がビデオビットストリーム110内に存在していないことを示すための値0を有することができる。
vcl_hrd_parameters_present_flag要素のようなVCL HRDパラメータ存在フラグ320は、VCLに関するHRD情報の存在を示すことができる。VCL HRDパラメータ存在フラグ320は、HRDベースシンタックス902が存在していることを示すための値1、及びHRDベースシンタックス902がビデオビットストリーム110内に存在していないことを示すための値0を有することができる。
NAL HRDパラメータ存在フラグ316又はVCL HRDパラメータ存在フラグ320が値1を有する場合には、HRDベースシンタックス902は、追加の要素を含むことができる。例えば、HRDベースシンタックス902は、サブピクチャCPBパラメータ存在フラグ324、ビットレートスケール410、CPBサイズスケール412、初期CPB除去遅延長422、CPB除去遅延長424、及びDPB出力遅延長426を含むことができる。
sub_pic_cpb_params_present_flag要素のようなサブピクチャCPBパラメータ存在フラグ324は、サブピクチャCPBパラメータがビデオビットストリーム110内に存在しているか否かを示すことができる。サブピクチャCPBパラメータ存在フラグ324が値1を有する場合には、HRDベースシンタックス902は、ビデオビットストリーム110で表すことができる最低時間間隔を指定するための、tick_divisor_minus2要素のような時間刻み除数912を含むことができる。
HRDベースシンタックス902は、bit_rate_scale要素のようなビットレートスケール410を含むことができる。ビットレートスケール410は、符号化ピクチャバッファ(CPB)の最大入力ビットレートを指定する。
HRDベースシンタックス902は、cpb_size_scale要素のようなCPBサイズスケール412を含むことができる。CPBサイズスケール412は、CPBのサイズを判定するためのものである。
HRDベースシンタックス902は、initial_cpb_removal_delay_length_minus1要素のような初期CPB除去遅延長422を含むことができる。初期CPB除去遅延長422は、バッファリング期間SEIメッセージのinitial_cpb_removal_delay要素及びinitial_cpb_removal_offset要素のビット長を示す。
HRDベースシンタックス902は、cpb_removal_delay_length_minus1要素のようなCPB除去遅延長424を含むことができる。CPB除去遅延長424は、ピクチャタイミングSEIメッセージ内のcpb_removal_delay要素のビット長を指定することができる。
HRDベースシンタックス902は、dpb_output_delay_length_minus1要素のようなDPB出力遅延長426を含むことができる。DPB出力遅延長426は、復号ピクチャバッファ(DPB)のサイズを示す。
HRDベースシンタックス902は、図2の時間レイヤ230の各オカレンスに関するパラメータセットを含むことができる。HRDベースシンタックス902は、時間レイヤ230の各オカレンスに関するパラメータを表すための[i]のようなイテレータを使用したループ構造を含むことができる。
HRDベースシンタックス902は、MaxNumSubLayersMinus1要素のようなサブレイヤカウント407を含むことができる。サブレイヤカウント407は、ビデオビットストリーム110内のサブレイヤの最大数を示す。
HRDベースシンタックス902は、ビデオビットストリーム110内のいずれか2つの連続的なピクチャのHRD出力時間の間の時間距離が制約されているか否かを示すための、fixed_pic_rate_flag要素のような固定ピクチャレートフラグ314を含むことができる。固定ピクチャレートフラグ314が値1を有する場合には、2つの連続的なピクチャ間の時間距離は制約されており、値0の場合には、制約されていない。
固定ピクチャレートフラグ314が値1を有する場合には、HRDベースシンタックス902は、pic_duration_in_tc_minus1要素のようなピクチャ期間910を含むことができる。ピクチャ期間910は、符号化されたビデオシーケンスにおける出力順序でのいずれか2つの連続的なピクチャのHRD出力時間の間の時間距離を示すことができる。
HRDベースシンタックス902は、low_delay_hrd_flag要素のような低遅延フラグ322を含むことができる。低遅延フラグ322は、HRD動作モードを示すことができる。
HRDベースシンタックス902は、cpb_cnt_minus1要素のようなCPBカウント408を含むことができる。CPBカウント408は、ビデオビットストリーム110内の別のCPB規格値の数を示すことができる。
NAL HRDパラメータ存在フラグ316が値1を有する場合には、HRDベースシンタックス902は、時間レイヤ230の各オカレンスに関して、hrd_parameters_sub_layer要素のようなHRDサブレイヤパラメータ構造908を含むことができる。HRDサブレイヤパラメータ構造908は、各サブレイヤに関連するパラメータを表すことができる。HRDサブレイヤパラメータ構造908は、時間レイヤ230の各サブレイヤに関するパラメータを含むことができる。各サブレイヤは、各時間レイヤ230及び関連する非VCL NALユニットに関連するVCL NALユニットを含むことができる。
VCL HRDパラメータ存在フラグ320が値1を有する場合には、HRDベースシンタックス902は、時間レイヤ230の各オカレンスに関して、hrd_parameters_sub_layer要素のようなHRDサブレイヤパラメータ構造908を含むことができる。HRDサブレイヤパラメータ構造908は、各サブレイヤに関連するパラメータを表すことができる。
HRDベースシンタックス902を使用して図1のビデオコンテンツ108を符号化及び復号することにより、ビデオビットストリーム110のサイズを減少させることができ、図1のビデオストリーム112を表示するために必要なビデオバッファリングの量を減少できることが見いだされている。ビデオビットストリーム110のサイズが減少することにより、機能性が向上し、ビデオストリーム112の表示性能が向上する。
ここで図10を参照すると、HRDサブレイヤシンタックス1002の実施例が示されている。HRDサブレイヤシンタックス1002は、仮想参照デコーダに関して図2の時間レイヤ230のサブレイヤに関連するパラメータを表す。
HRDサブレイヤシンタックス1002は、図10のHRDサブレイヤシンタックス表で表された要素を含む。HRDサブレイヤシンタックス1002の要素は、図10のHRDサブレイヤシンタックス表において表された階層構造で配列される。
HRDサブレイヤシンタックス1002は、HRD_parameters_sub_layer要素のようなHRDサブレイヤシンタックスヘッダ部1004を含むことができる。HRDサブレイヤシンタックスヘッダ部1004は、HRDサブレイヤシンタックス1002を識別するための記述子である。
HRDサブレイヤシンタックス1002は、符号化ピクチャバッファの各オカレンスに関するパラメータセットを規定するためのループ構造を含むことができる。ループ構造は、SchedSelIdx要素のようなスケジュール選択インデックス414に基づく大きさである。
HRDサブレイヤシンタックス1002は、bit_rate_value_minus1要素のようなビットレート値416を含むことができる。ビットレート値416を使用して、符号化ピクチャバッファの各オカレンスに関する最大入力ビットレートを指定することができる。
HRDサブレイヤシンタックス1002は、cpb_size_value_minus1要素のようなCPBサイズ値418を含むことができる。CPBサイズ値418を使用して、符号化ピクチャバッファの各オカレンスのサイズを判定することができる。
HRDサブレイヤシンタックス1002は、cbr_flag要素のようなCBRフラグ420を含むことができる。CBRフラグ420は、符号化ピクチャバッファの各オカレンスに関して図1のビデオビットストリーム110を復号するための動作モードを示す。CBRフラグ420が値1を有する場合には、仮想ストリーム配信スケジューラは、固定ビットレートモードで動作する。それ以外の場合には、ビデオビットストリーム110は、断続的なビットレートモードで動作する。
HRDサブレイヤシンタックス1002は、図2の時間レイヤ230の特性を表すことができる。時間レイヤ230は更に、図1のビデオビットストリーム110のサブレイヤとして示すことができる。
HRDサブレイヤシンタックス1002は、ビデオビットストリーム110のサブレイヤ又は時間レイヤ230を表すことができる。HRDサブレイヤシンタックス702を使用して、サブレイヤのうちの1つ又は時間レイヤ230のうちの1つを選択し、ビデオビットストリーム110から別のサブレイヤのオカレンスを取り除くことができる。
サブレイヤ又は時間レイヤ230からオカレンスを取り除くことにより、ビデオビットストリーム110内のデータ量全体を減少させることができ、より適切な伝達、改良されたストレージ帯域幅制御及び調整のために、図1のビデオコンテンツ108のビットレート低減又はサイズ変更が可能になる。サブレイヤ又は時間レイヤ固有のHRDパラメータを提供することにより、図1のビデオストリーム112を生成するためのより適切でより滑らかなビットストリーム復号が可能になる。
HRDサブレイヤシンタックス1002を使用することにより、時間レイヤ230に関連する個別のサブレイヤの処理にわたるより高精度で精細な制御を可能にすることによって性能を向上できることが見いだされている。HRDサブレイヤシンタックス1002の個別のオカレンスを使用することにより、種々のサブレイヤ間の個別の差分を利用することによって処理速度を向上することができる。
ここで図11を参照すると、HRD VUIシンタックス1102の実施例が示されている。HRD VUIシンタックス1102は、仮想参照デコーダに関連するパラメータを表す。
HRD VUIシンタックス1102は、図11のHRD VUIシンタックス表で表された要素を含む。HRD VUIシンタックス1102の要素は、図11のHRD VUIシンタックス表において表された階層構造で配列される。
HRD VUIシンタックス1102は、vui_parameters要素のようなHRD VUIシンタックスヘッダ部1104を含むことができる。HRD VUIシンタックスヘッダ部1104は、HRD VUIシンタックス1102を識別するための記述子である。
HRD VUIシンタックス1102は、図1のビデオコンテンツ108のアスペクト比に関するアスペクト比情報を含むことができる。HRD VUIシンタックス1102は、アスペクト比フラグ1106、アスペクト比インジケータ1108、アスペクト比幅1110、及びアスペクト比高さ1112、又はそれらの組み合わせを含むことができる。
HRD VUIシンタックス1102は、追加のアスペクト比情報が図1のビデオビットストリーム110内に符号化されていることを示すための、aspect_ratio_info_present_flag要素のようなアスペクト比フラグ1106を含むことができる。アスペクト比フラグ1106は、アスペクト比情報が、ビデオビットストリーム110内に存在していないことを示すための値0、及びアスペクト比情報が、ビデオビットストリーム110に含まれていることを示すための値1を有することができる。
アスペクト比インジケータ1108は、ビデオコンテンツ108のアスペクト比を表す値である。例えば、aspect_ratio_idc要素のようなアスペクト比インジケータ1108は、ビデオコンテンツ108に関する所定のアスペクト比の列挙型リストに関するインデックス値を含むことができる。別の実施例では、アスペクト比インジケータ1108は、アスペクト比が、アスペクト比幅1110及びアスペクト比高さ1112に関する個別の値で表すことができることを示す値を含むことができる。
sar_width要素のようなアスペクト比幅1110は、ビデオコンテンツ108の幅を表すことができる。sar_hight要素のようなアスペクト比高さ1112は、ビデオコンテンツ108の高さを表すことができる。アスペクト比幅1110及びアスペクト比高さ1112は、ビデオコンテンツの大きさを、比率、画素、線、インチ、センチメートル、又はそれらの組み合わせで表すことができる。
HRD VUIシンタックス1102は、ビデオコンテンツ108に関するオーバースキャン情報を含むことができる。HRD VUIシンタックス1102は、オーバースキャン存在フラグ1114及びオーバースキャン適切フラグ1116を含むことができる。
オーバースキャンは、図1のビデオストリーム112から切り取って復号されたピクチャの境界近くの一部の部分が、ビデオストリーム112の表示領域内で視認できない場合の表示処理として規定される。アンダースキャンは、ビデオストリーム112から切り取って復号されたピクチャ全体が、表示領域内で視認できるが、表示領域全体を対象として含んでいない場合の表示処理として規定される。
オーバースキャン存在フラグ1114は、オーバースキャン情報が、ビデオビットストリーム110に含まれているか否かを示すことができる。overscan_info_present_flagのようなオーバースキャン存在フラグ1114は、オーバースキャン情報が、ビデオビットストリーム内に存在していることを示すための値1、又はオーバースキャン情報が、ビデオビットストリーム110内に存在していないことを示すための値0を有することができる。
オーバースキャン適切フラグ1116は、ビデオビットストリーム110内に符号化されたビデオコンテンツ108が、オーバースキャンを使用して表示できることを示すことができる。overscan_appropriate_flag要素のようなオーバースキャン適切フラグ1116は、ビデオストリーム112から切り取って復号されたピクチャが、オーバースキャンを使用して表示するのに好適であることを示すための値1を有することができる。オーバースキャン適切フラグ1116は、ビデオストリーム112から切り取って復号されたピクチャが、視覚的に重要な情報を含み、オーバースキャンを使用して表示すべきでないことを示すための値0を有することができる。
HRD VUIシンタックス1102は、ビデオコンテンツ108に関するビデオ信号種類情報を含むことができる。HRD VUIシンタックス1102は、ビデオ信号存在フラグ1118、ビデオ形式1120、ビデオフルレンジフラグ1122、カラー記述存在フラグ1124、原色1126、伝達特性1128、及び行列係数1130を含むことができる。
video_signal_type_present_flag要素のようなビデオ信号存在フラグ1118は、ビデオ信号種類情報が、ビデオビットストリーム110に含まれていることを示すことができる。ビデオ信号存在フラグ1118は、追加のビデオ信号種類情報が、ビデオビットストリーム110内に存在していることを示すための値1を有することができる。ビデオ信号存在フラグ1118は、ビデオ信号種類情報が、ビデオビットストリーム110内に存在していないことを示すための値0を有することができる。
video_format要素のようなビデオ形式1120は、ビデオの形式を示すことができる。video_full_range_flag要素のようなビデオフルレンジフラグ1122は、ビデオビットストリーム110内に符号化されたビデオコンテンツ108に関する輝度及び色差信号の黒レベル及び範囲を示すことができる。
colour_description_present_flag要素のようなカラー記述存在フラグ1124は、ビデオビットストリーム110内のカラー記述情報の存在を示すことができる。カラー記述存在フラグ1124は、追加のカラー記述情報が、ビデオビットストリーム110に含まれていることを示すための値1を有することができる。カラー記述存在フラグ1124は、他のカラー記述情報が含まれていないことを示すための値0を有することができる。カラー記述情報は、原色1126、伝達特性1128、及び行列係数1130を含むことができる。
原色1126は、ビデオコンテンツ108内で使用されるカラースキームを示すことができる。例えば、colour_primaries要素のような原色1126は、元の原色の色度座標を示すことができる。
伝達特性1128は、ビデオコンテンツ108の光エレクトロニクス伝達特性を示すことができる。例えば、transfer_characteristics要素のような伝達特性1128は、所定の表示特性セットを表す列挙型値とすることができる。
行列係数1130は、原色1126で示される赤、緑、及び青の原色から輝度及び色差信号を得るために使用される係数を示すことができる。matrix_coefficient要素のような行列係数1130は、コンピュータにより赤、青、及び緑の色度座標セットを輝度及び色差均等値に変換するために使用される行列係数とすることができる。
HRD VUIシンタックス1102は、ビデオコンテンツ108に関する色差情報を含むことができる。HRD VUIシンタックス1102は、色差位置情報存在フラグ1132、色差最高部フィールドサンプル1134、色差最低部フィールドサンプル1136、及び中間色差フラグ1138を含むことができる。
chroma_loc_info_present_flag要素のような色差位置情報存在フラグ1132は、追加の色差情報が、ビデオビットストリーム110内に存在しているか否かを示すことができる。色差位置情報存在フラグ1132は、追加の色差情報が存在していることを示すための値1、又は追加の色差情報が存在していないことを示すための値0を有することができる。追加の色差情報は、色差最高部フィールドサンプル1134、及び色差最低部フィールドサンプル1136を含むことができる。
chroma_sample_loc_type_top_field要素のような色差最高部フィールドサンプル1134は、ビデオビットストリーム110内の最高部フィールドに関する色差サンプルの位置を指定するための列挙型値とすることができる。chroma_sample_loc_type_bottom_field要素のような色差最低部フィールドサンプル1136は、ビデオビットストリーム110内の最低部フィールドに関する色差サンプルの位置を指定するための列挙型値とすることができる。
neutral_chroma_indication_flag要素のような中間色差フラグ1138は、復号された色差サンプルが1に等しいか否かを示すことができる。例えば、中間色差フラグ1138が値1を有する場合には、復号された色差サンプルの全てが、1に設定されている。中間色差フラグ1138が値0を有する場合には、復号された色差サンプルは、1に制限されていない。
HRD VUIシンタックス1102は、field_seq_flagのようなフィールドシーケンスフラグ306を含むことができる。フィールドシーケンスフラグ306は、符号化されたビデオシーケンス情報が、ビデオ表現フィールドを含むか否かを示すことができる。
HRD VUIシンタックス1102は、hrd_parameters要素のようなHRDパラメータ構造318を含むことができる。HRDパラメータ構造318は、各サブレイヤに関する仮想参照デコーダパラメータを含む。
HRD VUIシンタックス1102は、bitstream_restriction_flag要素のようなビットストリーム制限フラグ328を含むことができる。ビットストリーム制限フラグ328が値1を有する場合には、HRD VUIシンタックス1102は、タイル固定構成フラグ330、動きベクトルフラグ332、ピクチャ種類毎の最大バイト数334、最少CU種類毎の最大ビット数336、動きベクトル最大水平距離338、及び動きベクトル最大垂直距離340を含むことができる。
tiles_fixed_structure_flag要素のようなタイル固定構成フラグ330は、符号化されたビデオシーケンス内の各ピクチャが、同じ数のタイルを有することを示すことができる。motion_vector_over_pic_boundaries_flag要素のような動きベクトルフラグ332は、ピクチャ境界の外部のサンプルが予測のために使用されないことを示すことができる。
max_bytes_per_pic_denom要素のようなピクチャ種類毎の最大バイト数334は、符号化されたビデオシーケンス内のいずれかの符号化されたピクチャに関連するVCL NALユニットの合計サイズに関する最大バイト数を示す値である。max_bits_per_min_cu_denom要素のような最少CU種類毎の最大ビット数336は、符号化されたビデオシーケンスのいずれかのピクチャ内のいずれかの符号化ブロックに関する符号化ユニットデータの符号化されたビット数に関する上限を示す値である。
log2_max_mv_length_horizontal要素のような動きベクトル最大水平距離338は、ビデオビットストリーム110内の全てのピクチャに関する復号された動きベクトル水平成分の最大絶対値を示す。log2_max_mv_length_vertical要素のような動きベクトル最大垂直距離340は、ビデオビットストリーム110内の全てのピクチャに関する復号された動きベクトル垂直成分の最大絶対値を示す。
HRD VUIシンタックス1102においてHRDパラメータ構造318を使用することにより、全てのサブレイヤに関する共通HRDパラメータを使用する代わりに個別のサブレイヤの処理にわたるより高精度で精細な制御を可能にすることによって性能を向上できることが見いだされている。HRDパラメータ構造318の個別のオカレンスを使用することにより、種々のサブレイヤ間の個別の差分を利用することによって処理速度を向上することができる。
ここで図12を参照すると、映像符号化システム100の機能ブロック図が示されている。映像符号化システム100は、第1のデバイス102、第2のデバイス104、及び通信経路106を含むことができる。
第1のデバイス102は、通信経路106を通じて第2のデバイス104と通信することができる。第1のデバイス102は、第1のデバイスの送信器1232において、通信経路106を通じて情報を第2のデバイス104に送信することができる。第2のデバイス104は、第2のデバイスの送信器1234において、通信経路106を通じて情報を第1のデバイス102に送信することができる。
例示的に、クライアントデバイスとして第1のデバイス102を含む映像符号化システム100を示しているが、映像符号化システム100は、種々の種類のデバイスとして第1のデバイス102を有することができることを理解されたい。例えば、第1のデバイスはサーバとすることができる。別の実施例では、第1のデバイス102は、ビデオエンコーダ102、ビデオデコーダ104、又はそれらの組み合わせとすることができる。
更に、例示的に、サーバとして第2のデバイス104を含む映像符号化システム100を示しているが、映像符号化システム100は、種々の種類のデバイスとして第2のデバイス104を有することができることを理解されたい。例えば、第2のデバイス104はクライアントデバイスとすることができる。別の実施例では、第2のデバイス104は、ビデオエンコーダ102、ビデオデコーダ104、又はそれらの組み合わせとすることができる。
本発明のこの実施形態の説明を簡潔にするために、第1のデバイス102は、ビデオカメラ、スマートフォン、又はそれらの組み合わせのようなクライアントデバイスとして示される。本発明は、デバイスの種類に関するこの選択に限定されるものではない。この選択は、本発明の実施例である。
第1のデバイス102は、第1の制御ユニット1208を含むことができる。第1の制御ユニット1208は、第1の制御インタフェース1214を含むことができる。第1の制御ユニット1208は、第1のソフトウェア1212を実行して、映像符号化システム100のインテリジェンスを提供することができる。
第1の制御ユニット1208は、いくつかの異なる方法で実装することができる。例えば、第1の制御ユニット1208は、プロセッサ、組み込みプロセッサ、マイクロプロセッサ、ハードウェア制御ロジック、ハードウェア有限状態機械(FSM)、デジタルシグナルプロセッサ(DSP)、又はそれらの組み合わせとすることができる。
第1の制御インタフェース1214は、第1の制御ユニット1208と第1のデバイス102内の別の機能ユニットとの間の通信のために使用することができる。第1の制御インタフェース1214は更に、第1のデバイス102の外部との通信のために使用することができる。
第1の制御インタフェース1214は、別の機能ユニット又は外部の情報源から情報を受信すること、或いは別の機能ユニット又は外部の送信先に情報を送信することができる。外部の情報源及び外部の送信先は、第1のデバイス102の外部の情報源及び送信先に言及するものである。
第1の制御インタフェース1214は、様々な方法で実装でき、どの機能ユニット又は外部ユニットが第1の制御インタフェース1214にインタフェース接続されているかに応じて様々な実施形態を含むことができる。例えば、第1の制御インタフェース1214は、電気回路、微小電気機械システム(MEMS)、光学的回路、無線回路、有線回路、又はそれらの組み合わせで実装することができる。
第1のデバイス102は、第1の記憶ユニット1204を含むことができる。第1の記憶ユニット1204は、第1のソフトウェア1212を格納することができる。第1の記憶ユニット1204は更に、画像、シンタックス情報、ビデオ、地図、特性情報、表示設定、センサデータ、又はそれらの任意の組み合わせのような関連情報を格納することができる。
第1の記憶ユニット1204は、揮発性メモリ、不揮発性メモリ、内部メモリ、外部メモリ、又はそれらの組み合わせとすることができる。例えば、第1の記憶ユニット1204は、不揮発性ランダムアクセスメモリ(NVRAM)、フラッシュメモリ、ディスクストレージのような不揮発性ストレージ、又はスタティックランダムアクセスメモリ(SRAM)のような揮発性ストレージとすることができる。
第1の記憶ユニット1204は、第1の記憶インタフェース1218を含むことができる。第1の記憶インタフェース1218は、第1の記憶ユニット1204と第1のデバイス102内の別の機能ユニットとの間の通信用に使用することができる。第1の記憶インタフェース1218は更に、第1のデバイス102の外部との通信用に使用することができる。
第1のデバイス102は、第1の画像化ユニット1206を含むことができる。第1の画像化ユニット1206は、現実世界から図1のビデオコンテンツ108を取り込むことができる。第1の画像化ユニット1206は、デジタルカメラ、ビデオカメラ、光センサ、又はそれらの任意の組み合わせを含むことができる。
第1の画像化ユニット1206は、第1の画像化インタフェース1216を含むことができる。第1の画像化インタフェース1216は、第1の画像化ユニット1206と第1のデバイス102内の別の機能ユニットとの間の通信用に使用することができる。
第1の画像化インタフェース1216は、別の機能ユニット又は外部の情報源から情報を受信すること、或いは別の機能ユニット又は外部の送信先に情報を送信することができる。外部の情報源及び外部の送信先は、第1のデバイス102の外部の情報源及び送信先に言及するものである。
第1の画像化インタフェース1216は、どの機能ユニット又は外部ユニットが第1の画像化ユニット1206にインタフェース接続されているかに応じて様々な実施形態を含むことができる。第1の画像化インタフェース1216は、第1の制御インタフェース1214の実施形態と同様な技術及び技法で実装することができる。
第1の記憶インタフェース1218は、別の機能ユニット又は外部の情報源から情報を受信すること、或いは別の機能ユニット又は外部の送信先に情報を送信することができる。外部の情報源及び外部の送信先は、第1のデバイス102の外部の情報源及び送信先に言及するものである。
第1の記憶インタフェース1218は、どの機能ユニット又は外部ユニットが第1の記憶ユニット1204にインタフェース接続されているかに応じて様々な実施形態を含むことができる。第1の記憶インタフェース1218は、第1の制御インタフェース1214の実施形態と同様な技術及び技法で実装することができる。
第1のデバイス102は、第1の通信ユニット1210を含むことができる。第1の通信ユニット1210は、第1のデバイス102への及びそれからの外部通信を可能にするためのものとすることができる。例えば、第1の通信ユニット1210は、第1のデバイス102が、第2のデバイス104、周辺デバイス又はデスクトップコンピュータのような付属装置、及び通信経路106と通信することを可能にする。
第1の通信ユニット1210は更に、第1のデバイス102が通信経路106の一部分として機能することを可能にし、通信経路106へのエンドポイント又は終端ユニットに限定されない、通信ハブとして機能することができる。第1の通信ユニット1210は、通信経路106との相互作用のための能動素子及び受動素子、例えば、マイクロエレクトロニクス又はアンテナを含むことができる。
第1の通信ユニット1210は、第1の通信インタフェース1220を含むことができる。第1の通信インタフェース1220は、第1の通信ユニット1210と第1のデバイス102内の別の機能ユニットとの間の通信用に使用することができる。第1の通信インタフェース1220は、別の機能ユニットから情報を受信すること、或いは別の機能ユニットに情報を送信することができる。
第1の通信インタフェース1220は、どの機能ユニットが第1の通信ユニット1210にインタフェース接続されているかに応じて様々な実施形態を含むことができる。第1の通信インタフェース1220は、第1の制御インタフェース1214の実施形態と同様な技術及び技法で実装することができる。
第1のデバイス102は、第1のユーザインタフェース1202を含むことができる。第1のユーザインタフェース1202は、ユーザ(図示せず)が第1のデバイス102と相互作用及び対話することを可能にする。第1のユーザインタフェース1202は、第1のユーザ入力(図示せず)を含むことができる。第1のユーザ入力は、タッチスクリーン、ジェスチャ、動き検出、ボタン、スライダ、ノブ、仮想ボタン、音声認識制御、又はそれらの任意の組み合わせを含むことができる。
第1のユーザインタフェース1202は、第1のディスプレイインタフェース120を含むことができる。第1のディスプレイインタフェース120は、ユーザが第1のユーザインタフェース1202と対話することを可能にすることができる。第1のディスプレイインタフェース120は、ディスプレイ、ビデオスクリーン、スピーカ、又はそれらの任意の組み合わせを含むことができる。
第1の制御ユニット1208は、第1のユーザインタフェース1202と連携して、映像符号化システム100によって生成されたビデオ情報を第1のディスプレイインタフェース120に表示することができる。第1の制御ユニット1208は更に、第1の記憶ユニット1204からビデオ情報を受信して第1のディスプレイインタフェース120に表示することを含む、映像符号化システム100の別の機能に関する第1のソフトウェア1212を実行することができる。第1の制御ユニット1208は更に、第1の通信ユニット1210経由で通信経路106と相互作用するための第1のソフトウェア1212を実行することができる。
例示的に、第1のデバイス102は、第1のユーザインタフェース1202、第1の記憶ユニット1204、第1の制御ユニット1208、及び第1の通信ユニット1210を有して分割することができるが、第1のデバイス102は、様々に分割できることを理解されたい。例えば、第1のソフトウェア1212は、その機能の一部又は全てが、第1の制御ユニット1208及び第1の通信ユニット1210内に存在できるように様々に分割することができる。更に、第1のデバイス102は、明確にするために図12に示していない他の機能ユニットを含むことができる。
映像符号化システム100は、第2のデバイス104を含むことができる。第2のデバイス104は、第1のデバイス102を含む複数デバイスの実施形態で本発明を実施するように最適化することができる。第2のデバイス104は、第1のデバイス102と比べて追加の又は高い性能の処理能力を提供することができる。
第2のデバイス104は、第2の制御ユニット1248を含むことができる。第2の制御ユニット1248は、第2の制御インタフェース1254を含むことができる。第2の制御ユニット1248は、第2のソフトウェア1252を実行して、映像符号化システム100のインテリジェンスを提供することができる。
第2の制御ユニット1248は、いくつかの異なる方法で実装することができる。例えば、第2の制御ユニット1248は、プロセッサ、組み込みプロセッサ、マイクロプロセッサ、ハードウェア制御ロジック、ハードウェア有限状態機械(FSM)、デジタルシグナルプロセッサ(DSP)、又はそれらの組み合わせとすることができる。
第2の制御インタフェース1254は、第2の制御ユニット1248と、第2のデバイス104内の別の機能ユニットとの間の通信用に使用することができる。第2の制御インタフェース1254は更に、第2のデバイス104の外部との通信用に使用することができる。
第2の制御インタフェース1254は、別の機能ユニット又は外部の情報源から情報を受信すること、或いは別の機能ユニット又は外部の送信先に情報を送信することができる。外部の情報源及び外部の送信先は、第2のデバイス104の外部の情報源及び送信先に言及するものである。
第2の制御インタフェース1254は、様々な方法で実装でき、どの機能ユニット又は外部ユニットが第2の制御インタフェース1254にインタフェース接続されているかに応じて様々な実施形態を含むことができる。例えば、第2の制御インタフェース1254は、電気回路、微小電気機械システム(MEMS)、光学的回路、無線回路、有線回路、又はそれらの組み合わせで実装することができる。
第2のデバイス104は、第2の記憶ユニット1244を含むことができる。第2の記憶ユニット1244は、第2のソフトウェア1252を格納することができる。第2の記憶ユニット1244は更に、画像、シンタックス情報、ビデオ、地図、特性情報、表示設定、センサデータ、又はそれらの任意の組み合わせのような関連情報を格納することができる。
第2の記憶ユニット1244は、揮発性メモリ、不揮発性メモリ、内部メモリ、外部メモリ、又はそれらの組み合わせとすることができる。例えば、第2の記憶ユニット1244は、不揮発性ランダムアクセスメモリ(NVRAM)、フラッシュメモリ、ディスクストレージのような不揮発性ストレージ、又はスタティックランダムアクセスメモリ(SRAM)のような揮発性ストレージとすることができる。
第2の記憶ユニット1244は、第2の記憶インタフェース1258を含むことができる。第2の記憶インタフェース1258は、第2の記憶ユニット1244と、第2のデバイス104内の別の機能ユニットとの間の通信用に使用することができる。第2の記憶インタフェース1258は更に、第2のデバイス104の外部との通信用に使用することができる。
第2の記憶インタフェース1258は、別の機能ユニット又は外部の情報源から情報を受信すること、或いは別の機能ユニット又は外部の送信先に情報を送信することができる。外部の情報源及び外部の送信先は、第2のデバイス104の外部の情報源及び送信先に言及するものである。
第2の記憶インタフェース1258は、どの機能ユニット又は外部ユニットが第2の記憶ユニット1244にインタフェース接続されているかに応じて様々な実施形態を含むことができる。第2の記憶インタフェース1258は、第2の制御インタフェース1254の実施形態と同様な技術及び技法で実装することができる。
第2のデバイス104は、第2の画像化ユニット1246を含むことができる。第2の画像化ユニット1246は、現実世界から図1のビデオコンテンツ108を取り込むことができる。第1の画像化ユニット1206は、デジタルカメラ、ビデオカメラ、光センサ、又はそれらの組み合わせを含むことができる。
第2の画像化ユニット1246は、第2の画像化インタフェース1256を含むことができる。第2の画像化インタフェース1256は、第2の画像化ユニット1246と第2のデバイス104内の別の機能ユニットとの間の通信用に使用することができる。
第2の画像化インタフェース1256は、別の機能ユニット又は外部の情報源から情報を受信すること、或いは別の機能ユニット又は外部の送信先に情報を送信することができる。外部の情報源及び外部の送信先は、第2のデバイス104の外部の情報源及び送信先に言及するものである。
第2の画像化インタフェース1256は、どの機能ユニット又は外部ユニットが第2の画像化ユニット1246にインタフェース接続されているかに応じて様々な実施形態を含むことができる。第2の画像化インタフェース1256は、第1の制御インタフェース1214の実施形態と同様な技術及び技法で実装することができる。
第2のデバイス104は、第2の通信ユニット1250を含むことができる。第2の通信ユニット1250は、第2のデバイス104への及びそれからの外部通信を可能にすることができる。例えば、第2の通信ユニット1250は、第2のデバイス104が、第1のデバイス102、周辺デバイス又はデスクトップコンピュータのような付属装置、及び通信経路106と通信することを可能にする。
第2の通信ユニット1250は更に、通信ハブとして機能することができ、第2のデバイス104が、通信経路106の一部分として機能すること及び通信経路106へのエンドポイント又は終端ユニットに限定されないことを可能にする。第2の通信ユニット1250は、通信経路106との相互作用のための能動素子及び受動素子、例えば、マイクロエレクトロニクス又はアンテナを含むことができる。
第2の通信ユニット1250は、第2の通信インタフェース1260を含むことができる。第2の通信インタフェース1260は、第2の通信ユニット1250と、第2のデバイス104内の別の機能ユニットとの間の通信用に使用することができる。第2の通信インタフェース1260は、別の機能ユニットから情報を受信すること、或いは別の機能ユニットに情報を送信することができる。
第2の通信インタフェース1260は、どの機能ユニットが第2の通信ユニット1250にインタフェース接続されているかに応じて様々な実施形態を含むことができる。第2の通信インタフェース1260は、第2の制御インタフェース1254の実施形態と同様な技術及び技法で実装することができる。
第2のデバイス104は、第2のユーザインタフェース1242を含むことができる。第2のユーザインタフェース1242は、ユーザ(図示せず)が第2のデバイス104と相互作用及び対話することを可能にする。第2のユーザインタフェース1242は、第2のユーザ入力(図示せず)を含むことができる。第2のユーザ入力は、タッチスクリーン、ジェスチャ、動き検出、ボタン、スライダ、ノブ、仮想ボタン、音声認識制御、又はそれらの任意の組み合わせを含むことができる。
第2のユーザインタフェース1242は、第2のディスプレイインタフェース1243を含むことができる。第2のディスプレイインタフェース1243は、ユーザが第2のユーザインタフェース1242と対話することを可能にすることができる。第2のディスプレイインタフェース1243は、ディスプレイ、ビデオスクリーン、スピーカ、又はそれらの任意の組み合わせを含むことができる。
第2の制御ユニット1248は、第2のユーザインタフェース1242と連携して、映像符号化システム100によって生成された情報を第2のディスプレイインタフェース1243に表示することができる。第2の制御ユニット1248は更に、第2の記憶ユニット1244から表示情報を受信して第2のディスプレイインタフェース1243に表示することを含む、映像符号化システム100の別の機能に関する第2のソフトウェア1252を実行することができる。第2の制御ユニット1248は更に、第2の通信ユニット1250経由で通信経路106と相互作用するための第2のソフトウェア1252を実行することができる。
例示的に、第2のデバイス104は、第2のユーザインタフェース1242、第2の記憶ユニット1244、第2の制御ユニット1248、及び第2の通信ユニット1250を有するように分割することができるが、第2のデバイス104は、様々に分割できることを理解されたい。例えば、第2のソフトウェア1252は、その機能の一部又は全てが、第2の制御ユニット1248及び第2の通信ユニット1250内に存在できるように様々に分割することができる。更に、第2のデバイス104は、明確にするために図12に示していない他の機能ユニットを含むことができる。
第1の通信ユニット1210は、通信経路106に接続して、第1のデバイスの送信器1232で情報を第2のデバイス104に送信することができる。第2のデバイス104は、第2の通信ユニット1250において、通信経路106の第1のデバイスの送信器1232から情報を受信することができる。
第2の通信ユニット1250は、通信経路106に接続して、第2のデバイスの送信器1234でビデオ情報を第1のデバイス102に送信することができる。第1のデバイス102は、第1の通信ユニット1210において、通信経路106の第2のデバイスの送信器1234からビデオ情報を受信することができる。映像符号化システム100は、第1の制御ユニット1208、第2の制御ユニット1248、又はそれらの組み合わせによって実行することができる。
第1のデバイス102内の機能ユニットは、個別に他の機能ユニットと無関係に動作することができる。例示的に、映像符号化システム100は、第1のデバイス102の動作によって説明される。第1のデバイス102は、映像符号化システム100の任意のモジュール及び機能を動作させることができることを理解されたい。例えば、第1のデバイス102は、第1の制御ユニット1208を動作させるように説明することができる。
第2のデバイス104内の機能ユニットは、個別に他の機能ユニットと無関係に動作することができる。例示的に、映像符号化システム100は、第2のデバイス104の動作によって説明することができる。第2のデバイス104は、映像符号化システム100の任意のモジュール及び機能を動作させることができることを理解されたい。例えば、第2のデバイス104は、第2の制御ユニット1248を動作させるように説明される。
例示的に、映像符号化システム100は、第1のデバイス102及び第2のデバイス104の動作によって説明される。第1のデバイス102及び第2のデバイス104は、映像符号化システム100の任意のモジュール及び機能を動作させることができることを理解されたい。例えば、第1のデバイス102は、第1の制御ユニット1208を動作させるように説明されるが、更に第2のデバイス104が、第1の制御ユニット1208を動作させることができることを理解されたい。
ここで図13を参照すると、図1の映像符号化システム100の制御フロー1300が示されている。制御フロー1300は、ビデオビットストリーム110を受信し、図1のビデオシンタックス114を抽出し、ビデオビットストリーム110を復号し、図1のビデオストリーム112を表示することによって、図1のビデオビットストリーム110を復号することを示している。
映像符号化システム100は、受信モジュール1302を含むことができる。受信モジュール1302は、図1のビデオエンコーダ102によって符号化されたビデオビットストリーム110を受信することができる。
ビデオビットストリーム110は、様々な方法で受信することができる。例えば、ビデオビットストリーム110は、図1のビデオエンコーダ102から、ストリーミングシリアルビットストリームとして、図1の通信経路106を通じたデジタルメッセージ(図示せず)内に事前に符号化されたビデオファイル(図示せず)として、又はそれらの組み合わせとして受信することができる。
ビデオビットストリーム110は、様々なフレームレートで図1のビデオコンテンツ108を表すための、図2の1つ又はそれ以上の時間レイヤ230を含むことができる。受信モジュール1302は、時間レイヤ230を選択的にフィルタ処理して、ビデオビットストリーム110のサイズを低減することができる。
例えば、受信モジュール1302は、60fps、30fps、及び15fpsのような3つの異なるフレームレートに関する時間レイヤ230を有するビデオビットストリーム110を受信することができる。受信モジュール1302は、ビデオビットストリーム110をフィルタ処理して、時間レイヤ230の60fps及び30fpsのオカレンスを取り除き、時間レイヤ230の15fpsオカレンスのみを処理することができる。
映像符号化システム100は、シンタックス取得モジュール1304を含むことができる。シンタックス取得モジュール1304は、ビデオビットストリーム110のビデオシンタックス114を識別及び抽出することができる。
シンタックス取得モジュール1304は、時間レイヤ取得モジュール1308及び時間レイヤ復号モジュール1310を含むことができる。
シンタックス取得モジュール1304は、様々な方法でビデオビットストリーム110に関するビデオシンタックス114を抽出することができる。例えば、シンタックス取得モジュール1304は、ビデオシンタックス114の存在を示すビデオ表示情報ヘッダ部に関してビデオビットストリーム110を検索することによって、ビデオシンタックス114を抽出することができる。別の実施例では、ビデオシンタックス114は、デマルチプレクサ(図示せず)を使用してビデオビットストリーム110のビデオ画像データからビデオシンタックス114を分離することで、ビデオビットストリーム110から抽出することができる。
更に別の実施例では、ビデオシンタックス114は、シーケンスパラメータセットであるローバイトシーケンスペイロード(Raw Byte Sequence Payload)(RBSP)シンタックスを抽出することによって、ビデオビットストリーム110から抽出することができる。シーケンスパラメータセットRBSPは、ネットワーク抽象レイヤユニット内にカプセル化された整数のバイトを含むシンタックス構造である。RBSPは、空とすること、或いはシンタックス要素と、その後に続くRBSPストップビットと、その後に続く、ゼロ又は0に等しいより多くの付加ビットを含むデータビット列の形式を有することの何れかとすることができる。
ビデオシンタックス114は、個別の要素がビデオビットストリーム110における時間順番で利用可能になる場合にこれらの要素を抽出することによって、時間的方法でシリアルビットストリームから抽出することができる。映像符号化システム100は、前に抽出された要素の値に基づいて後の要素を選択的に抽出及び処理することができる。例えば、シンタックス取得モジュール1304は、図3の低遅延HRDフラグ322の以前に受信した値に基づいて、図3のHRDパラメータ構造318を処理することができる。
別の実施例では、ビデオビットストリーム110をファイル内で受け取る場合には、ビデオシンタックス114は、ビデオビットストリーム110を含むファイルのファイル拡張子を調査することによって検出することができる。更に別の実施例では、図1の通信経路106を通じてデジタルメッセージとしてビデオビットストリーム110を受信する場合には、ビデオシンタックス114は、デジタルメッセージ構成の一部分として提供することができる。
シンタックス取得モジュール1304は、低遅延フラグ322の以前に抽出されたオカレンスに基づいて、HRDパラメータ構造318を使用してビデオビットストリーム110を動的に復号することによって、性能を向上させることができることが見いだされている。例えば、低遅延フラグ322を受信することにより、HRDパラメータ構造318を適用する場合にCPBにおいて許容されている遅延レベルを変更することによって、復号性能が向上する。
シンタックス取得モジュール1304は、図2のシンタックスタイプ202に基づいてビデオシンタックス114の個別の要素を抽出することができる。シンタックスタイプ202は、AVCビデオ、SVCビデオ、MVCビデオ、MVDビデオ、SSVビデオ、又はそれらの組み合わせを含むことができる。
シンタックス取得モジュール1304は、ビデオ表示情報を有するビデオシンタックス114を抽出することができる。ビデオシンタックス114は、図3のHEVC VUIスケーラブル拡張シンタックス302、図7の第1のHEVC VUI拡張シンタックス702、図8の第2のHEVC VUI拡張シンタックス802、図11のHRD VUIシンタックス1102、又はそれらの組み合わせを含むことができる。
シンタックス取得モジュール1304は、仮想参照デコーダ情報を有するビデオシンタックス114を抽出することができる。ビデオシンタックス114は、図12のHRDベースシンタックス902、図4のHRDシンタックス402、図5のHRD固定シンタックス502、図6のHRD可変シンタックス602、図10のHRDサブレイヤシンタックス1002、又はそれらの組み合わせを含むことができる。シンタックス取得モジュール1304は、hrd_parameters_fixed_nal要素及びhrd_parameters_fixed_vcl要素を表すビデオシンタックス114を抽出することができる。
ビデオシンタックス114は、様々な構造を有することができる。例えば、HEVC VUIスケーラブル拡張シンタックス302は、時間レイヤ230の全てのオカレンスに関して1つのHRDシンタックス402オカレンスを含むことができる。
HRDシンタックス402は、図4のCPBカウント408、図4のビットレートスケール410、図4のCPBサイズスケール412、図4の初期CPB除去遅延長422、図4のCPB除去遅延長424、図4のDPB出力遅延長426、及び図4の時間オフセット長428の単一のオカレンスを含むことができる。HRDシンタックス402は、CPBカウント408で示される各符号化ピクチャバッファに関して、図4のビットレート値416、図4のCPBサイズ値418、及び図4のCBRフラグ420の複数のオカレンスを含むループ構造を含むことができる。
別の実施例では、シンタックス取得モジュール1304は、第1のHEVC VUI拡張シンタックス702のようなビデオシンタックス114をビデオビットストリーム110から抽出することができる。第1のHEVC VUI拡張シンタックス702は、HRD固定シンタックス502の単一のオカレンスを含むことができる。HRD固定シンタックス502は、ビットレートスケール410、CPBサイズスケール412、初期CPB除去遅延長422、CPB除去遅延長424、DPB出力遅延長426、及び時間オフセット長428を含むことができる。
第1のHEVC VUI拡張シンタックス702は、時間レイヤ230の個別の各オカレンスに関する、HRD可変シンタックス602のオカレンスを含むことができる。HRD可変シンタックス602は、符号化ピクチャバッファの全体数を示すための、CPBカウント408の単一のオカレンスを含むことができる。HRD可変シンタックス602は、CPBカウント408で示される各符号化ピクチャバッファに関するビットレート値416、CPBサイズ値418、及びCBRフラグ420の複数のオカレンスを含むループ構造を含むことができる。
更に別の実施例では、シンタックス取得モジュール1304は、第2のHEVC VUI拡張シンタックス802のようなビデオシンタックス114をビデオビットストリーム110から抽出することができる。第2のHEVC VUI拡張シンタックス802は、図8のHRD NAL固定パラメータ構造806及び図8のHRD VCL固定パラメータ構造808の単一のオカレンスを含むことができる。
第2のHEVC VUI拡張シンタックス802は、時間レイヤ230の個別の各オカレンスに関する、HRD可変シンタックス602のオカレンスを含むことができる。HRD可変シンタックス602は、符号化ピクチャバッファの全体数を示すための、CPBカウント408の単一のオカレンスを含むことができる。HRD可変シンタックス602は、CPBカウント408で示される各符号化ピクチャバッファに関するビットレート値416、CPBサイズ値418、及びCBRフラグ420の複数のオカレンスを含むループ構造を含むことができる。
例示的な実施例では、シンタックス取得モジュール1304は、ビデオシンタックス114を構文解析することによってビデオビットストリーム110からHRD固定シンタックス502を抽出することができる。別の例示的な実施例では、HRD固定シンタックス502を抽出することは、HRD NAL固定パラメータ構造806及びHRD VCL固定パラメータ構造808を抽出することを含むことができる。
映像符号化システム100は、復号モジュール1306を含むことができる。復号モジュール1306は、ビデオシンタックス114を使用してビデオビットストリーム110を復号してビデオストリーム112を生成することができる。復号モジュール1306は、時間レイヤ取得モジュール1308及び時間レイヤ復号モジュール1310を含むことができる。
復号モジュール1306は、HEVC VUIスケーラブル拡張シンタックス302、第1のHEVC VUI拡張シンタックス702、第2のHEVC VUI拡張シンタックス802、HRD VUIシンタックス1102、又はそれらの組み合わせのようなビデオシンタックス114を使用してビデオビットストリーム110を復号することができる。復号モジュール1306は、HRDシンタックス402、HRD固定シンタックス502、HRD可変シンタックス602、HRDベースシンタックス902、HRDサブレイヤシンタックス1002、又はそれらの組み合わせを使用して、時間レイヤ230を識別及び抽出することができる。
時間レイヤ取得モジュール1308は、時間レイヤ230を識別し、ビデオビットストリーム110から抽出してビデオストリーム112を生成することができる。時間レイヤ取得モジュール1308は、様々な方法で時間レイヤ230を識別することができる。
例えば、時間レイヤ取得モジュール1308は、第1のHEVC VUI拡張シンタックス702又は第2のHEVC VUI拡張シンタックス802のようなビデオシンタックス114から図3の時間レイヤカウント304を抽出することによって、時間レイヤ230を識別することができる。時間レイヤカウント304は、ビデオビットストリーム110内の時間レイヤ230の全体数を示す。
時間レイヤ取得モジュール1308は、ビデオシンタックス114を使用してビデオビットストリーム110から時間レイヤ230を抽出することができる。ビデオシンタックス114は、図7のHRD固定パラメータ構造706、HRD NAL固定パラメータ構造806、HRD VCL固定パラメータ構造808、及び図7のHRD可変パラメータ構造708のような固定及び可変仮想参照デコーダパラメータ構造を含むことができる。
時間レイヤ取得モジュール1308は、ビデオシンタックス114に基づいてビデオビットストリーム110内のデータを構文解析することによって時間レイヤ230を抽出することができる。ビデオシンタックス114は、時間レイヤ230の数及び構成を規定することができる。
例えば、時間レイヤ取得モジュール1308は、時間レイヤカウント304を使用し、時間レイヤ230の全体数を判定してビデオビットストリーム110から抽出することができる。図11のビデオ形式1120をビデオビットストリーム110から抽出して、ビデオコンテンツ108の映像システムの種類を判定することができる。
別の実施例では、CPBカウント408を使用して使用される符号化ピクチャバッファの数を判定し、時間レイヤ230を抽出することができる。ビットレートスケール410を使用して符号化ピクチャバッファに関する最大入力ビットレートを判定することができる。CPBサイズスケール412を使用して符号化ピクチャバッファのサイズを判定することができる。各符号化ピクチャバッファに関して、ビットレート値416及びCPBサイズ値418が存在する。
例示的な実施例では、時間レイヤ取得モジュール1308は、HRD固定シンタックス502及びHRD可変シンタックス602に基づいて、ビデオビットストリーム110から、時間レイヤ230の図2の第1のオカレンス232及び図2の第2のオカレンス234を抽出することができる。HRD固定シンタックス502は、全ての時間レイヤ230に関して共通である。HRD可変シンタックス602は、各時間レイヤ230に関して異なるオカレンスを含む。
時間レイヤ230の第1のオカレンス232は、HRD可変シンタックス602の第1のオカレンスを使用して抽出することができる。時間レイヤ230の第2のオカレンス234は、HRD可変シンタックス602の第2のオカレンスを使用して抽出することができる。
時間レイヤ復号モジュール1310は、時間レイヤ取得モジュール1308から時間レイヤ230を受け取り、時間レイヤ230を復号してビデオストリーム112を生成することができる。時間レイヤ復号モジュール1310は、様々な方法で時間レイヤ230を復号することができる。
例えば、時間レイヤ復号モジュール1310は、HRDベースシンタックス902を使用して、時間レイヤ230を復号することができる。別の実施例では、時間レイヤ復号モジュール1310は、HRDサブレイヤシンタックス1002を使用して、時間レイヤ230を復号することができる。時間レイヤ復号モジュール1310は、時間レイヤ230を復号し、時間レイヤ230のうちの1つを選択してビデオストリーム112を生成することができる。
映像符号化システム100は、表示モジュール1312を含むことができる。表示モジュール1312は、復号モジュール1306からビデオストリーム112を受け取り、図1のディスプレイインタフェース120に表示することができる。ビデオストリーム112は、時間レイヤ230の1つ又はそれ以上のオカレンスを含むことができる。
ビデオコンテンツ108の物理的対象物の光学的画像から図1のディスプレイインタフェース120の画素要素にビデオストリーム112を表示する物理的な変換は、物理的世界におけるディスプレイインタフェース120の画素要素に対する物理的変化、例えば画素要素の電気的な状態の変化を引き起こすが、これは、映像符号化システム100の動作に基づくものである。ビデオコンテンツ108に取り込まれた対象物の動きのような物理的世界における変化が生じる場合、その動き自体により、ビデオコンテンツ108に対する更新のような追加情報が生成され、この情報は、映像符号化システム100の継続動作のためにディスプレイインタフェース120の画素要素での変化に逆変換される。
第1のデバイス102の図12の第1のソフトウェア1212は、映像符号化システム100を含むことができる。例えば、第1のソフトウェア1212は、受信モジュール1302、シンタックス取得モジュール1304、復号モジュール1306、及び表示モジュール1312を含むことができる。
図12の第1の制御ユニット1208は、受信モジュール1302に関する第1のソフトウェア1212を実行して、ビデオビットストリーム110を受信することができる。第1の制御ユニット1208は、シンタックス取得モジュール1304に関する第1のソフトウェア1212を実行して、ビデオビットストリーム110からビデオシンタックス114を識別及び抽出することができる。第1の制御ユニット1208は、復号モジュール1306に関する第1のソフトウェア1212を実行して、ビデオビットストリーム112を生成することができる。第1の制御ユニット1208は、表示モジュール1312に関する第1のソフトウェア1212を実行して、ビデオストリーム112を表示することができる。
図1の第2のデバイス104の図12の第2のソフトウェア1252は、映像符号化システム100を含むことができる。第2のソフトウェア1252は、例えば、受信モジュール1302、シンタックス取得モジュール1304、及び復号モジュール1306を含むことができる。
図12の第2の制御ユニット1248は、受信モジュール1302に関する第2のソフトウェア1252を実行して、ビデオビットストリーム110を受信することができる。第2の制御ユニット1248は、シンタックス取得モジュール1304に関する第2のソフトウェア1252を実行して、ビデオビットストリーム110からビデオシンタックス114を識別及び抽出することができる。第2の制御ユニット1248は、復号モジュール1306に関する第2のソフトウェア1252を実行して、図1のビデオビットストリーム112を生成することができる。第2の制御ユニット1248は、表示モジュール1312に関する第2のソフトウェアを実行して、ビデオストリーム112を表示することができる。
映像符号化システム100は、第1のソフトウェア1212と第2のソフトウェア1252とに分割することができる。例えば、第2のソフトウェア1252は、シンタックス取得モジュール1304、復号モジュール1306、及び表示モジュール1312を含むことができる。第2の制御ユニット1248は、前述した第2のソフトウェア1252に対して分割されたモジュールを実行することができる。
例示的な実施例では、映像符号化システム100は、第1のデバイス102でのビデオエンコーダ102、及び第2のデバイス104でのビデオデコーダ104を含むことができる。ビデオデコーダ104は、図1のディスプレイプロセッサ118、及びディスプレイインタフェース120を含むことができる。
第1のソフトウェア1212は、受信モジュール1302及びシンタックス取得モジュール1304を含むことができる。図12の第1の記憶ユニット1204のサイズに応じて、第1のソフトウェア1212は、映像符号化システム100の追加のモジュールを含むことができる。第1の制御ユニット1208は、前述した第1のソフトウェア1212に対して区分化されたモジュールを実行することができる。
第1の制御ユニット1208は、図12の第1の通信ユニット1210を動作させて、第2のデバイス104にビデオビットストリーム110を送信することができる。第1の制御ユニット1208は、第1のソフトウェア1212を動作させて、図12の第1の画像化ユニット1206を動作させることができる。図12の第2の通信ユニット1250は、通信経路106を通じて第1のデバイス102にビデオストリーム112を送信することができる。
映像符号化システム100は、実施例としてモジュールの機能又は順番を説明している。モジュールは様々に分割することができる。例えば、シンタックス取得モジュール1304と復号モジュール1306とを組み合わせることができる。各モジュールは、個別に他のモジュールと無関係に動作することができる。
更に、1つのモジュールで生成されたデータは、互いに直接接続されていない別のモジュールで使用することができる。例えば、復号モジュール1306は、受信モジュール1302からビデオビットストリーム110を受信することができる。
モジュールは、様々な方法で実装することができる。受信モジュール1302、シンタックス取得モジュール1304、復号モジュール1306、及び表示モジュール1312は、第1の制御ユニット1208又は第2の制御ユニット1248内のハードウェアアクセラレータ(図示せず)で実装すること、或いは第1の制御ユニット1208又は第2の制御ユニット1248の外部で第1のデバイス102又は第2のデバイス104内のハードウェアアクセラレータ(図示せず)で実装することができる。
ここで図14を参照すると、本発明の別の実施形態における図1の映像符号化システム100の動作方法1400のフローチャートが示されている。方法1400は、ブロック1402において、ビデオビットストリームを受信する段階と、ブロック1404において、ビデオビットストリームからビデオシンタックスを抽出する段階と、ブロック1406において、ビデオシンタックから仮想参照デコーダ(HRD)固定シンタックスを抽出する段階と、ブロック1408において、ビデオシンタックからHRD可変シンタックスを抽出する段階と、ブロック1410において、HRD固定シンタックス及びHRD可変シンタックスに基づいてビデオビットストリームから時間レイヤを抽出する段階と、ブロック1412において、デバイスに表示するために、時間レイヤに基づいてビデオストリームを生成する段階と、を含む。
このように、本発明は多くの態様を有することが見いだされている。本発明は、経費削減、システム単純化、及び性能向上という歴史的傾向に有用に対応し、その要求に応えている。結果的に、本発明の前記及び他の有用な態様により、技術レベルが少なくとも次のレベルに進む。
従って、本発明の映像符号化システムは、高精細アプリケーション用のビデオコンテンツを効率的に符号化及び復号することに関して、重要で、従来は知られておらず利用不可能な解決手段、機能、及び機能的態様を提供することが見いだされている。結果として得られるプロセス及び構成は、簡単で、費用効率が高く、複雑でなく、非常に汎用的で、効率的なものであり、意外にも自明ではなく、公知の技術を適用することによって実装できるので、従来の製造プロセス及び技術と完全に互換性がある映像符号化デバイスを簡単に効率的かつ経済的に製造することに適している。結果として得られるプロセス及び構成は、簡単で、費用効率が高く、複雑でなく、非常に汎用的で、正確で、高精度で、効率的なものであり、容易に、効率的に、経済的に製造、応用、及び利用するために公知の構成要素を適用することによって実装することができる。
本発明は、特定の最適な形態と併せて説明されるが、当業者であれば、前記の説明を考慮すると多くの代替例、修正例、及び変更例が明らかであることを理解できるはずである。従って、特許請求の範囲の範疇に含まれる全ての当該代替例、修正例、変更例が含まれることが意図されている。本明細書で説明した又は添付図面に示した前記の内容は、全て、例示的かつ非限定的な意味で解釈されたい。
1402 ビデオビットストリームを受信
1404 ビデオシンタックスを抽出
1406 HRD固定シンタックスを抽出
1408 HRD可変シンタックスを抽出
1410 時間レイヤを抽出
1412 ビデオストリームを生成

Claims (14)

  1. 符号化ビットストリームのサブレイヤの符号化ピクチャバッファ(CPB)の最大入力ビットレート又はCPBサイズを、複数のサブレイヤに共通する仮想参照デコーダ(HRD)パラメータを含むHRD固定シンタックスに含まれる第1パラメータ及び各サブレイヤに固有のHRDパラメータを含むHRD可変シンタックスに含まれる第2パラメータにより特定して、前記サブレイヤを含む前記符号化ビットストリームを復号する復号部、
    を備える復号装置。
  2. 前記第1パラメータは、bit_rate_scaleであり、
    前記第2パラメータは、bit_rate_value_minus1であり、
    前記復号部は、前記第1パラメータ及び前記第2パラメータにより前記最大入力ビットレートを特定する、
    請求項1に記載の復号装置。
  3. 前記第1パラメータは、cpb_size_scaleであり、
    前記第2パラメータは、cpb_size_value_minus1であり、
    前記復号部は、前記第1パラメータ及び前記第2パラメータにより前記CPBサイズを特定する、
    請求項1に記載の復号装置。
  4. 前記HRD固定シンタックスは、initial_cpb_removal_delay_length_minus1を含む、
    請求項1に記載の復号装置。
  5. 前記HRD固定シンタックスは、cpb_removal_delay_length_minus1を含む、
    請求項1に記載の復号装置。
  6. 前記HRD固定シンタックスは、dpb_output_delay_length_minus1を含む、
    請求項1に記載の復号装置。
  7. 前記HRD固定シンタックスは、全てのサブレイヤに共通するHRDパラメータを含む、
    請求項1に記載の復号装置。
  8. 復号装置により実行される復号方法であって、
    符号化ビットストリームのサブレイヤの符号化ピクチャバッファ(CPB)の最大入力ビットレート又はCPBサイズを、複数のサブレイヤに共通する仮想参照デコーダ(HRD)パラメータを含むHRD固定シンタックスに含まれる第1パラメータ及び各サブレイヤに固有のHRDパラメータを含むHRD可変シンタックスに含まれる第2パラメータにより特定して、前記サブレイヤを含む前記符号化ビットストリームを復号すること、
    を含む復号方法。
  9. 前記第1パラメータは、bit_rate_scaleであり、
    前記第2パラメータは、bit_rate_value_minus1であり、
    前記第1パラメータ及び前記第2パラメータにより前記最大入力ビットレートが特定される、
    請求項8に記載の復号方法。
  10. 前記第1パラメータは、cpb_size_scaleであり、
    前記第2パラメータは、cpb_size_value_minus1であり、
    前記第1パラメータ及び前記第2パラメータにより前記CPBサイズが特定される、
    請求項8に記載の復号方法。
  11. 前記HRD固定シンタックスは、initial_cpb_removal_delay_length_minus1を含む、
    請求項8に記載の復号方法。
  12. 前記HRD固定シンタックスは、cpb_removal_delay_length_minus1を含む、
    請求項8に記載の復号方法。
  13. 前記HRD固定シンタックスは、dpb_output_delay_length_minus1を含む、
    請求項8に記載の復号方法。
  14. 前記HRD固定シンタックスは、全てのサブレイヤに共通するHRDパラメータを含む、
    請求項8に記載の復号方法。
JP2017176290A 2012-07-02 2017-09-14 復号装置及び復号方法 Active JP6390775B2 (ja)

Applications Claiming Priority (6)

Application Number Priority Date Filing Date Title
US201261667286P 2012-07-02 2012-07-02
US61/667,286 2012-07-02
US201261677324P 2012-07-30 2012-07-30
US61/677,324 2012-07-30
US13/757,679 US20140003534A1 (en) 2012-07-02 2013-02-01 Video coding system with temporal scalability and method of operation thereof
US13/757,679 2013-02-01

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2016144408A Division JP6217808B2 (ja) 2012-07-02 2016-07-22 符号化方法、符号化装置及びプログラム

Publications (2)

Publication Number Publication Date
JP2018023139A JP2018023139A (ja) 2018-02-08
JP6390775B2 true JP6390775B2 (ja) 2018-09-19

Family

ID=49778154

Family Applications (3)

Application Number Title Priority Date Filing Date
JP2015520619A Active JP5987981B2 (ja) 2012-07-02 2013-07-01 復号方法、復号装置及びプログラム
JP2016144408A Active JP6217808B2 (ja) 2012-07-02 2016-07-22 符号化方法、符号化装置及びプログラム
JP2017176290A Active JP6390775B2 (ja) 2012-07-02 2017-09-14 復号装置及び復号方法

Family Applications Before (2)

Application Number Title Priority Date Filing Date
JP2015520619A Active JP5987981B2 (ja) 2012-07-02 2013-07-01 復号方法、復号装置及びプログラム
JP2016144408A Active JP6217808B2 (ja) 2012-07-02 2016-07-22 符号化方法、符号化装置及びプログラム

Country Status (6)

Country Link
US (4) US20140003534A1 (ja)
EP (1) EP2853092B1 (ja)
JP (3) JP5987981B2 (ja)
KR (3) KR101799742B1 (ja)
CN (3) CN104396254B (ja)
WO (1) WO2014008175A1 (ja)

Families Citing this family (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9912941B2 (en) 2012-07-02 2018-03-06 Sony Corporation Video coding system with temporal layers and method of operation thereof
US20140003534A1 (en) * 2012-07-02 2014-01-02 Sony Corporation Video coding system with temporal scalability and method of operation thereof
US9967583B2 (en) * 2012-07-10 2018-05-08 Qualcomm Incorporated Coding timing information for video coding
US9351005B2 (en) 2012-09-24 2016-05-24 Qualcomm Incorporated Bitstream conformance test in video coding
WO2014069920A1 (en) * 2012-11-01 2014-05-08 Samsung Electronics Co., Ltd. Recording medium, reproducing device for providing service based on data of recording medium, and method thereof
US9374585B2 (en) * 2012-12-19 2016-06-21 Qualcomm Incorporated Low-delay buffering model in video coding
US20150103878A1 (en) * 2013-10-14 2015-04-16 Qualcomm Incorporated Device and method for scalable coding of video information
JP6483028B2 (ja) * 2014-05-23 2019-03-13 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America 画像符号化方法及び画像符号化装置
JP6768096B2 (ja) * 2014-05-23 2020-10-14 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America 画像符号化方法及び画像復号装置
US10356415B2 (en) 2014-06-20 2019-07-16 Qualcomm Incorporated Systems and methods for constraining representation format parameters for a parameter set
US20160234522A1 (en) * 2015-02-05 2016-08-11 Microsoft Technology Licensing, Llc Video Decoding
WO2017041271A1 (en) 2015-09-10 2017-03-16 Mediatek Singapore Pte. Ltd. Efficient context modeling for coding a block of data
EP3930333A4 (en) * 2019-02-21 2022-04-06 Panasonic Intellectual Property Corporation of America ENCODING DEVICE, DECODING DEVICE, ENCODING METHOD AND DECODING METHOD
PL4064706T3 (pl) 2019-03-11 2023-08-21 Dolby Laboratories Licensing Corporation Sygnalizowanie informacji związanej z kątem otwarcia migawki
WO2020185879A1 (en) 2019-03-11 2020-09-17 Dolby Laboratories Licensing Corporation Video coding using reference picture resampling supporting region of interest
EP4011079A1 (en) 2019-08-06 2022-06-15 Dolby Laboratories Licensing Corporation Canvas size scalable video coding
KR20220065060A (ko) * 2019-09-24 2022-05-19 후아웨이 테크놀러지 컴퍼니 리미티드 다계층 비디오 비트스트림에서 사용되지 않는 계층 금지
WO2021242873A1 (en) 2020-05-26 2021-12-02 Dolby Laboratories Licensing Corporation Picture metadata for variable frame-rate video

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2004006446A2 (en) * 2002-07-02 2004-01-15 Conexant Systems, Inc. Hypothetical reference decoder for compressed image and video
US7266147B2 (en) 2003-03-31 2007-09-04 Sharp Laboratories Of America, Inc. Hypothetical reference decoder
US8615038B2 (en) * 2004-12-06 2013-12-24 Nokia Corporation Video coding, decoding and hypothetical reference decoder
JP2008536420A (ja) * 2005-04-13 2008-09-04 ノキア コーポレイション スケーラビリティ情報の符号化、格納およびシグナリング
JP5535646B2 (ja) * 2007-01-05 2014-07-02 トムソン ライセンシング スケーラブル映像符号化用の仮想リファレンスデコーダ
EP2137973B1 (en) * 2007-04-12 2019-05-01 InterDigital VC Holdings, Inc. Methods and apparatus for video usability information (vui) for scalable video coding (svc)
WO2008130528A2 (en) * 2007-04-17 2008-10-30 Thomson Licensing Hypothetical reference decoder for multiview video coding
BR122012013077A2 (pt) * 2007-04-18 2015-07-14 Thomson Licensing Sinal tendo parâmetros de decodificação para codificação de vídeo de múltiplas vistas
US9188850B2 (en) * 2007-09-10 2015-11-17 L-3 Communications Corporation Display system for high-definition projectors
BR122012021950A2 (pt) * 2007-10-05 2015-08-04 Thomson Licensing Aparelho para incorporação de informação de usabilidade de vídeo (vui) em um sistema de codificação de vídeo com múltiplos visualizações (mvc)
US20100232520A1 (en) * 2007-11-05 2010-09-16 Zhenyu Wu Scalable video coding method for fast channel change and increased error relilience
JP5553553B2 (ja) 2009-08-20 2014-07-16 キヤノン株式会社 映像処理装置及び映像処理装置の制御方法
CN115442623B (zh) * 2012-06-29 2024-08-23 Ge视频压缩有限责任公司 解码视频数据流的方法、存储介质、编码器、解码器
US9912941B2 (en) * 2012-07-02 2018-03-06 Sony Corporation Video coding system with temporal layers and method of operation thereof
US20140003534A1 (en) * 2012-07-02 2014-01-02 Sony Corporation Video coding system with temporal scalability and method of operation thereof

Also Published As

Publication number Publication date
KR20170062547A (ko) 2017-06-07
CN104396254A (zh) 2015-03-04
US20140003534A1 (en) 2014-01-02
US20190273932A1 (en) 2019-09-05
US20200366912A1 (en) 2020-11-19
EP2853092B1 (en) 2021-02-17
CN110519596A (zh) 2019-11-29
JP6217808B2 (ja) 2017-10-25
KR20150024862A (ko) 2015-03-09
KR101759048B1 (ko) 2017-07-31
WO2014008175A1 (en) 2014-01-09
CN104396254B (zh) 2017-09-26
CN107360425A (zh) 2017-11-17
KR101799742B1 (ko) 2017-11-20
JP2018023139A (ja) 2018-02-08
JP2015529034A (ja) 2015-10-01
JP5987981B2 (ja) 2016-09-07
JP2016213874A (ja) 2016-12-15
US20170105015A1 (en) 2017-04-13
EP2853092A1 (en) 2015-04-01
CN107360425B (zh) 2019-11-19
EP2853092A4 (en) 2016-01-20
KR20160134859A (ko) 2016-11-23
KR101678290B1 (ko) 2016-11-21
CN110519596B (zh) 2023-06-02

Similar Documents

Publication Publication Date Title
JP6390775B2 (ja) 復号装置及び復号方法
JP6606048B2 (ja) 符号化装置及び符号化方法
JP6128261B2 (ja) 符号化装置、方法及びプログラム

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20180709

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20180724

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20180806

R151 Written notification of patent or utility model registration

Ref document number: 6390775

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151